大數據分析方法交流(PPT 22頁)
大數據分析方法交流(PPT 22頁)內容簡介
引言
數據分析的工作框架
數據分析的實施流程
總結
言數據必稱“大”的時代
交通大數據、旅遊大數據、網購大數據
2011年開始的各種各樣的“V”:
Volume、Variety、Velocity(Value、Veracity-真實性)
各種全新的配套手段:
存儲(雲);處理(並行);
保護(安全性);分析(數據挖掘、機器學習)
潛力無限vs言過其實?
創新為主vs傳承為主?
思考1:“大”數據,到底應該多大?
量級不嚴格、範圍不嚴格
思考2:新方法,到底有多新?
大多數傳承傳統方式
新方法解決麵窄
思考3:新結論,到底多有價值?
陳述事實多,推理結論少
展示效果好,實踐應用差
總結:大數據更多是一種新的數據觀
充分認識數據的價值(潛力與局限)
正確選擇分析的方法
零售數據分析:我們的優勢
1、擁有最精華的數據,產出結論有說服力
(大而全不一定是長處:收集成本高、篩選困難)
2、時間長涵蓋麵廣,便於比較分析
我們需要仔細分析的是:
想做什麼
能做什麼
怎樣做
工作框架
需要的結論:既想要也想得到的
數據資源和分析方法大量擴充—右半邊擴張
分析對象理解和問題思考有所不足—左半邊停滯
最重要的還是商業思維
充分擴展兩個部分,首先代表:
理解宏觀問題
給出係統假設
將假設化簡至可被數據分析
其次,兩項工作無法忽視:
充分研究了解對象—我們想要知道什麼
(發現問題)
判斷我們想要研究的問題是否有意義
(減少人力損耗)
數據分析的六個階段
1、對研究對象主觀的和客觀的、整體的和局部的認識
2、提出希望探索的宏觀的問題(自由的或是有明確的)
3、探討分析這些問題並產生結論的價值
4、為選出的研究問題提出充分的假設。
5、將研究假設進行拆解、劃分成為可定量分析的單元。
6、結合數據資源和數據分析方法產生結論,驗證假設及理論的擴展性。
兩個重要問題
產生的結論要有理論解釋
反麵例子:消費額和停車場大小正相關
..............................
數據分析的工作框架
數據分析的實施流程
總結
言數據必稱“大”的時代
交通大數據、旅遊大數據、網購大數據
2011年開始的各種各樣的“V”:
Volume、Variety、Velocity(Value、Veracity-真實性)
各種全新的配套手段:
存儲(雲);處理(並行);
保護(安全性);分析(數據挖掘、機器學習)
潛力無限vs言過其實?
創新為主vs傳承為主?
思考1:“大”數據,到底應該多大?
量級不嚴格、範圍不嚴格
思考2:新方法,到底有多新?
大多數傳承傳統方式
新方法解決麵窄
思考3:新結論,到底多有價值?
陳述事實多,推理結論少
展示效果好,實踐應用差
總結:大數據更多是一種新的數據觀
充分認識數據的價值(潛力與局限)
正確選擇分析的方法
零售數據分析:我們的優勢
1、擁有最精華的數據,產出結論有說服力
(大而全不一定是長處:收集成本高、篩選困難)
2、時間長涵蓋麵廣,便於比較分析
我們需要仔細分析的是:
想做什麼
能做什麼
怎樣做
工作框架
需要的結論:既想要也想得到的
數據資源和分析方法大量擴充—右半邊擴張
分析對象理解和問題思考有所不足—左半邊停滯
最重要的還是商業思維
充分擴展兩個部分,首先代表:
理解宏觀問題
給出係統假設
將假設化簡至可被數據分析
其次,兩項工作無法忽視:
充分研究了解對象—我們想要知道什麼
(發現問題)
判斷我們想要研究的問題是否有意義
(減少人力損耗)
數據分析的六個階段
1、對研究對象主觀的和客觀的、整體的和局部的認識
2、提出希望探索的宏觀的問題(自由的或是有明確的)
3、探討分析這些問題並產生結論的價值
4、為選出的研究問題提出充分的假設。
5、將研究假設進行拆解、劃分成為可定量分析的單元。
6、結合數據資源和數據分析方法產生結論,驗證假設及理論的擴展性。
兩個重要問題
產生的結論要有理論解釋
反麵例子:消費額和停車場大小正相關
..............................
下一篇:尚無數據
用戶登陸
大數據熱門資料
大數據相關下載