大數據與分布式計算介紹(PPT 65頁)
大數據與分布式計算介紹(PPT 65頁)內容簡介
大數據與分布式計算
HDFS
常用RAID技術
HDFS係統架構
什麼是HDFS?
HDFS設計目標
不適合HDFS的場景
設計目標
HDFS主要組件的功能
文件
分而治之(DivideandConquer)
MapReduce
MapReduce:大規模數據處理
MapReduce特性
WordCount
Hive
HiveQL–Join
HiveQL–JoininMapReduce
了解Hive的意義
Hive架構
Hive執行流程
Hive操作符
Hive編譯器
Spark
Spark生態係統
Spark任務處理流程
SparkSQL
SparkStreaming
GraphX
Tachyon
Spark架構
Spark的基本組件。
Spark運行邏輯
..............................
HDFS
常用RAID技術
HDFS係統架構
什麼是HDFS?
HDFS設計目標
不適合HDFS的場景
設計目標
HDFS主要組件的功能
文件
分而治之(DivideandConquer)
MapReduce
MapReduce:大規模數據處理
MapReduce特性
WordCount
Hive
HiveQL–Join
HiveQL–JoininMapReduce
了解Hive的意義
Hive架構
Hive執行流程
Hive操作符
Hive編譯器
Spark
Spark生態係統
Spark任務處理流程
SparkSQL
SparkStreaming
GraphX
Tachyon
Spark架構
Spark的基本組件。
Spark運行邏輯
..............................
用戶登陸
大數據熱門資料
大數據相關下載