您現在的位置: 18luck新利全站下载 >> 管理信息化>> 人工智能>> 資料信息

機器學習簡明原理(DOC 47頁)

所屬分類:
人工智能
文件大小:
622 KB
下載地址:
相關資料:
機器學習
機器學習簡明原理(DOC 47頁)內容簡介
內容摘要
機器學習簡明原理
說明:本文整理自IBM大數據學習文檔,原文作者:韓笑琳
1. 關於機器學習的簡介
機器學習是從大量數據中學習出特定規律的算法。其中提到的規律有很多種,比如分類、聚類、回歸、關聯分析等。
分類就是給定大量帶標簽的數據,計算出未知標簽樣本的標簽取值。如年齡 40 歲以上、工科、研究生以上學曆,這類人薪資水平是高收入;年齡 20-30 歲、文科、大專學曆,這類人的薪資水平是低收入;現有一位 23 歲大專文科人士,求該人的薪資水平是哪類?根據分類建模,就可以知道這個人的薪資水平很可能是低收入。
聚類是將大量不帶標簽的數據根據距離聚集成不同的簇,每一簇數據有共同的特征。如電信行業可以根據用戶的月長途電話分鍾數、上網時長、短信使用數、地理位置、月消費數,將所有用戶聚集成有典型特征的簇,聚集出的某簇特征可能是月長途電話分鍾數長、上網時間長、地理位置變化不大、月消費數目低,分析可得這類人極有可能是在校大學生,那麼電信公司就可以針對這類特定人群製定有針對性的營銷策略。
回歸是根據特征值、目標變量擬合出特征值與目標變量之間的函數關係,可用來估計特征值對應的目標變量的可能取值。舉個簡單的例子,某市今年某 100 平米的房子價格是 80 萬,某 150 平米房子價格是 120 萬,那麼某 200 平米的房子價格的取值就可能是 200*0.8=160 萬左右。
關聯分析是計算出大量數據之間的頻繁項集合。如超市訂單中有大量訂單同時包含啤酒與尿布,這其中的頻繁項就是啤酒和尿布,那麼超市就可以針對這個規律對啤酒和尿布進行組合促銷活動。
分類算法主要包括K近鄰、決策樹、樸素貝葉斯、邏輯回歸、支持向量機、AdaBoost等;回歸主要包括線性回歸、嶺回歸、lasso、樹回歸等;聚類主要包括 K-Means 以及它的各種變形算法;關聯分析主要包括 Apriori、FP-growth 等算法。

..............................
機器學習簡明原理(DOC 47頁)
Baidu
map