大數據框架及應用(PDF 39頁)
- 所屬分類:
- 大數據
- 文件大小:
- 1138 KB
- 下載地址:
- 相關資料:
- 大數據應用
大數據框架及應用(PDF 39頁)內容簡介
目錄
前言 1
一、 大數據的內涵 . 4
(一) 什麼是大數據 . 5
(二) 大數據有何不同 . 5
(三) 大數據的風險 . 6
(四) 大數據的結構 . 6
(五) 探索大數據 . 6
(六) 有效過濾大數據 . 7
(七) 今天的大數據將不再是明天的大數據 . 7
(八) 行業大數據麵臨的挑戰 . 7
二、 大數據源有哪些 . 9
(一) 網絡大數據 . 9
網絡數據揭示了什麼 9
(二) 文本數據 . 10
文本數據的用途 10
(三) RFID 數據 . 11
RFID 數據的用途 11
(四) 社交網絡數據 . 12
三、 大數據應用案例 . 13
(一) 互聯網公司:Netflix . 13
(二) 傳統 IT 公司:IBM 13
(三) 金融:Derwent 基金 13
(四) 傳統零售企業:沃爾瑪 . 14
四、 大數據處理的架構(流程) 15
(一) 大數據處理的架構 . 15
(二) 大數據處理的流程 . 16
1) 大數據處理流程之‐‐采集 . 16
2) 大數據處理流程之‐‐統計分析 . 17
3) 大數據處理流程之‐‐挖掘 . 18
五、 大數據常用的算法與數據結構 20
(一) 布隆過濾器(Bloom Filter) 20
(二) 跳躍表 . 20
(三) LSM 樹 . 21
(四) Merkle 哈希樹 . 21
(五) Snappy 與 LZSS 算法 . 22
(六) Cuckoo 哈希 22
六、 大數據的計算模型 . 23
(一) MapReduce 模型 . 23
1) 計算模型 . 23
2) 實例:單詞統計 . 23
3) 係統架構 . 24
4) MapReduce 計算的特點及不足 . 25
(二) DAG 模型 . 26
1) DAG 計算係統的三層結構 . 26
2) Dryad 整體架構 26
(三) 流式計算 . 27
係統架構 28
七、 大數據處理工具 . 30
(一) Hadoop 30
(二) HPCC 30
(三) Storm . 31
(四) Apache Drill . 32
(五) RapidMiner 32
(六) Pentaho BI . 33
八、 南方平台與大數據的結合 。
(一) 南方平台的簡介 。
(二) 南方平台的數據來源 。
附錄 34
(一) 為什麼使用 nosql 數據庫 34
(二) NoSQL 數據庫的特點 . 35
(三) NoSQL 數據庫的類型 . 35
1) 鍵值(Key‐Value)數據庫 . 35
2) 麵向文檔(Document‐Oriented)數據庫 . 36
3) 列存儲(Wide Column Store/Column‐Family)數據庫 36
4) 圖(Graph‐Oriented)數據庫 . 37
參考文獻
..............................
前言 1
一、 大數據的內涵 . 4
(一) 什麼是大數據 . 5
(二) 大數據有何不同 . 5
(三) 大數據的風險 . 6
(四) 大數據的結構 . 6
(五) 探索大數據 . 6
(六) 有效過濾大數據 . 7
(七) 今天的大數據將不再是明天的大數據 . 7
(八) 行業大數據麵臨的挑戰 . 7
二、 大數據源有哪些 . 9
(一) 網絡大數據 . 9
網絡數據揭示了什麼 9
(二) 文本數據 . 10
文本數據的用途 10
(三) RFID 數據 . 11
RFID 數據的用途 11
(四) 社交網絡數據 . 12
三、 大數據應用案例 . 13
(一) 互聯網公司:Netflix . 13
(二) 傳統 IT 公司:IBM 13
(三) 金融:Derwent 基金 13
(四) 傳統零售企業:沃爾瑪 . 14
四、 大數據處理的架構(流程) 15
(一) 大數據處理的架構 . 15
(二) 大數據處理的流程 . 16
1) 大數據處理流程之‐‐采集 . 16
2) 大數據處理流程之‐‐統計分析 . 17
3) 大數據處理流程之‐‐挖掘 . 18
五、 大數據常用的算法與數據結構 20
(一) 布隆過濾器(Bloom Filter) 20
(二) 跳躍表 . 20
(三) LSM 樹 . 21
(四) Merkle 哈希樹 . 21
(五) Snappy 與 LZSS 算法 . 22
(六) Cuckoo 哈希 22
六、 大數據的計算模型 . 23
(一) MapReduce 模型 . 23
1) 計算模型 . 23
2) 實例:單詞統計 . 23
3) 係統架構 . 24
4) MapReduce 計算的特點及不足 . 25
(二) DAG 模型 . 26
1) DAG 計算係統的三層結構 . 26
2) Dryad 整體架構 26
(三) 流式計算 . 27
係統架構 28
七、 大數據處理工具 . 30
(一) Hadoop 30
(二) HPCC 30
(三) Storm . 31
(四) Apache Drill . 32
(五) RapidMiner 32
(六) Pentaho BI . 33
八、 南方平台與大數據的結合 。
(一) 南方平台的簡介 。
(二) 南方平台的數據來源 。
附錄 34
(一) 為什麼使用 nosql 數據庫 34
(二) NoSQL 數據庫的特點 . 35
(三) NoSQL 數據庫的類型 . 35
1) 鍵值(Key‐Value)數據庫 . 35
2) 麵向文檔(Document‐Oriented)數據庫 . 36
3) 列存儲(Wide Column Store/Column‐Family)數據庫 36
4) 圖(Graph‐Oriented)數據庫 . 37
參考文獻
..............................
用戶登陸
大數據熱門資料
大數據相關下載