傳統的海量數據分析方案(PPT 45頁)
傳統的海量數據分析方案(PPT 45頁)內容簡介
傳統的海量數據分析方案
Apache Hadoop項目
Apache Hadoop
HDFS設計
HDFS體係結構
MapReduce-“分而治之”
聚集查詢(SUM、AVG等)
MapReduce
MapReduce執行流程
MapReduce容錯
MapReduce容忍節點異構
Yahoo Pig& FaceBook Hive
HIVE體係結構
數據模型
Hive中的數據共享
Hive優點
Hive缺點
Spark
Spark容錯
海量日誌分析示例
Spark支持的操作
Spark優點
Hive體係結構
Shark體係結構
Stinger/Tez
Tez
Stinger體係結構
Impala
Impala體係結構
Impala支持的數據格式
大數據引擎測試
測試環境
..............................
Apache Hadoop項目
Apache Hadoop
HDFS設計
HDFS體係結構
MapReduce-“分而治之”
聚集查詢(SUM、AVG等)
MapReduce
MapReduce執行流程
MapReduce容錯
MapReduce容忍節點異構
Yahoo Pig& FaceBook Hive
HIVE體係結構
數據模型
Hive中的數據共享
Hive優點
Hive缺點
Spark
Spark容錯
海量日誌分析示例
Spark支持的操作
Spark優點
Hive體係結構
Shark體係結構
Stinger/Tez
Tez
Stinger體係結構
Impala
Impala體係結構
Impala支持的數據格式
大數據引擎測試
測試環境
..............................
用戶登陸
大數據熱門資料
大數據相關下載