您現在的位置: 18luck新利全站下载 >> 管理信息化>> 大數據>> 資料信息

大數據的介紹及案例分享(DOC 25頁)

所屬分類:
大數據
文件大小:
55 KB
下載地址:
相關資料:
大數據
大數據的介紹及案例分享(DOC 25頁)內容簡介
內容摘要
大數據的概念
大數據(Big Data)是指“無法用現有的軟件工具提取、存儲、搜索、共享、分析和處理的海量的、複雜的數據集合。
網絡上每一筆搜索,網站上每一筆交易、每一筆輸入都是數據,通過計算機做篩選、整理、分析,所得出的結果可不僅僅隻得到簡單、客觀的結論,更能用於幫助企業經營決策,搜集起來的數據還可以被規劃,引導開發更大的消費力量。
大數據與傳統數據的區別?
銀行做數據業務做了十多年,那麼大數據和傳統數據的倉庫有哪些差異?實際上就是群體和個體的差異。互聯網數據完全瞄向個體,數據結構也是精準於個體,而傳統的數據麵向經營指標、麵向群體。
宏觀意義上來看,假如小明去了一百次書店,以前要回答的問題是他第一百零一次買不買書,即業績和經營指標的問題;而現在,互聯網關心的是什麼?最關心的是他第一百零一次買什麼書,需要將什麼樣的內容推薦給他。這不是一個概率問題,而是一個模糊的程度問題。
要量化這個程度,我們一定要基於個體,而不是基於群體的共性描述。傳統定義上,更多關注的是一類人群,用同一類規則製訂套餐給他們;而在互聯網時代,要把每個人都精準刻畫出來,進行精準匹配。有電商說他們要做到一百萬用戶要有一百萬個商店,特別是在移動的小屏幕上,三次點擊以後就會損失一個客戶。所以差異化絕對不可能是對群體共性的描述,而完全是對個體差異的刻畫。
關於大數據的深度分析,很重要內容就是個性化的信息推薦。個性化的信息推薦不僅僅是基於用戶的相似性這麼簡單的東西,還有大量比較深入的複雜模型。比如說,就用戶看資訊而言,我們怎麼樣去判斷一個用戶點開一條八卦資訊後,是繼續深挖八卦到死,還是轉而瀏覽另外一個新聞。同樣,有的用戶登陸淘寶隻是逛逛而已,有些用戶則是很明確地想要買一些東西,這就需要對用戶的意圖進行預測,這裏麵涉及到一些比較難的機器學習技術。

..............................

Baidu
map