大數據平台解決方案規劃(PPT 139頁)
主要內容
大數據平台概述
大數據服務能夠在哪些方麵為企業客戶提供價值?
大數據服務麵向的三類企業客戶
大數據平台的三種服務交付方式
Data Warehouse as a Service數據倉儲即服務
Data Warehouse as a Service的服務交付方式
Analytics as a Service分析平台即服務
Analytics as a Service的服務交付方式
Intelligence as a Service 智能即服務
Intelligence as a Service的服務交付方式
係統邊界
源數據接口S1-S8
互動接口
三級平台架構
三級平台功能架構
三級平台功能架構(續)
二級大數據平台功能架構
二級平台各層的功能
二級平台各層的功能(續)
集成架構
數據集成在大數據平台中的位置
省級數據集成和二級大數據平台數據集成的關係
數據集成的類型
大數據平台支持的多類型數據集成
傳統的BI係統數據ETL存在的難題
基於雲計算的非實時並行數據集成的特點
核心技術——分布式存儲
Hadoop概述
核心技術——基於Map/Reduce的並行計算
並行計算的流程
基於雲計算的並行數據集成模塊的功能架構
集成環境
與傳統ETL比較 —— 容錯性與擴展性
物理部署
將文本類非結構化數據轉化為結構化數據
核心技術——中文分詞
中文分詞的核心難點
核心技術——基於數據挖掘的文本分類,將非結構化數據轉化為結構化數據
文本分類的核心挖掘算法
文本分類的核心挖掘算法(續)
多類型數據集成
流數據的特點
流數據處理的關鍵技術——S4分布式流計算平台
S4的特點
技術原理
流數據處理的其它商用產品——IBM StreamBase CEP
流數據處理的其它商用產品——Sybase Aleri Event Stream Processor
流數據集成的應用場景——信令數據處理
VDC虛擬數據中心的IT合理化思路
IaaS架構相對於傳統IT架構的優勢
通過IaaS架構實現IT資源合理化
IaaS架構的實現:資源管理平台和基礎設施雲化
1、資源管理平台
資源管理平台的邏輯結構
資源管理平台的功能模塊
資源管理平台的特點
資源管理平台的端到端工作流程
2、基礎設施雲化
基礎設施雲化可降低能耗、節約電力成本
通過基礎設施雲化構建綠色數據中心
新一代綠色智能數據中心:模塊化數據中心
大數據混合式存儲架構概述
從傳統的分析型和交易型係統通用的數據庫逐步向分析型係統專用的數據庫轉變
關鍵技術——列數據庫
列式數據庫與行式數據庫在分析型係統中的性能對比
列數據庫的商用產品——Sybase IQ
列數據庫的商用產品——HP Vertica
關鍵技術——MPP數據庫
Share-nothing 架構
商用產品——IBM Netezza Appliance
商用產品——EMC Greenplum
大數據存儲和處理的關鍵技術——Hadoop
大數據存儲和處理的關鍵技術——NoSQL
NoSQL的產品——Membase
NOSQL的產品——MongoDB
大數據存儲和處理的關鍵技術——流數據處理引擎
大數據平台的邏輯數據架構
混合式存儲架構
混合式存儲架構(續)
PaaS平台概述
為什麼要打造大數據PaaS平台?
PaaS平台的目標
PaaS平台提供的核心開發支撐能力
能力一:統一數據訪問和處理引擎
基礎支撐能力一:統一數據訪問和處理引擎(續)
數據支撐示例——用戶六維全息視圖
基礎支撐能力二:數據挖掘引擎
基礎支撐能力三:工作流引擎
基礎支撐能力四:數據可視化引擎
PaaS平台的開發和運行環境架構
統一的開發環境—應用開發、發布的流程
統一數據訪問的實現
統一運行環境—應用容器
支持多開發商的應用部署和管理
支持多開發商的應用部署和管理(續)
PaaS平台的監控管理能力
PaaS平台化的意義
行業解決方案示例
為什麼客戶的手機等智能終端的上網行為至關重要?
分析用戶的手機上網行為可以真正了解客戶,幫助中國移動在多個維度上真正實現差異化營銷和服務
示例
手機上網行為分析的前提——基於文本挖掘的URL智能分析
保證海量文本數據的挖掘效率和實時性——雲計算平台
應用場景示例——基於三類中高端客戶的手機上網行為特征實現差異化營銷
手機上網行為分析的功能
1 熱門網站和應用分析
網站和應用推薦—應用於激發用戶流量使用
案例:通過定製特定網站和應用的流量資費,激發用戶使用流量
基於內容偏好的用戶分群
2 熱門內容分析
3 時間-內容相關分析
捕捉最佳營銷時機
4 關鍵字激增識別
事件營銷
5 內容傳播軌跡
引爆點營銷
6 區域群體特征
關注某熱門內容的用戶分布
7 終端升級需求挖掘
行業解決方案
醫療行業運營管理平台
平台核心分析模型
信用卡欺詐模式識別
信用卡欺詐行為主要模式
信用卡欺詐識別實施效果
酒店行業智能化數據分析
界麵示例
解決方案的特點
..............................