基本概念、決策樹與模型評價(ppt 92頁)
基本概念、決策樹與模型評價(ppt 92頁)內容簡介
分類
數據分類——一個兩步過程 (1)
數據分類——一個兩步過程 (2)
有監督的學習 VS. 無監督的學習
分類模型的構造方法
一個決策樹的例子
決策樹的另一個例子
用決策樹歸納分類
決策樹分類任務
應用決策樹進行分類
決策樹分類
決策樹
Hunt算法
怎樣為不同類型的屬性指定測試條件?
基於標稱屬性的分裂
基於序數屬性的劃分
基於連續屬性的劃分
怎樣選擇最佳劃分?
怎樣找到最佳劃分?
結點不純性的測量
不純性的測量: GINI
計算 GINI的例子
基於 GINI的劃分
二元屬性: 計算 GINI
標稱屬性:計算Gini
熵---定義
基於 Information Gain的劃分
計算 Entropy的例子
基於 Information Gain的劃分...
基於 Classification Error的劃分
例子
不純性度量之間的比較
停止分裂過程
三種著名的決策樹
子樹重複問題
決策邊界
斜決策樹
模型過分擬合和擬合不足
模型模型過分擬合和擬合不足
導致過分擬合的原因
噪聲導致的過分擬合(例子)
缺乏代表性樣本導致的過分擬合
過分擬合與多重比較
泛化誤差估計
結合模型複雜度
悲觀誤差評估
最小描述長度 (MDL)
使用確認集
處理決策樹中的過分擬合
處理決策樹中的過分擬合…
不平衡類問題
準確率的缺點
度量
ROC (Receiver Operating Characteristic)
使用ROC曲線比較模型
怎樣產生ROC曲線
..............................
數據分類——一個兩步過程 (1)
數據分類——一個兩步過程 (2)
有監督的學習 VS. 無監督的學習
分類模型的構造方法
一個決策樹的例子
決策樹的另一個例子
用決策樹歸納分類
決策樹分類任務
應用決策樹進行分類
決策樹分類
決策樹
Hunt算法
怎樣為不同類型的屬性指定測試條件?
基於標稱屬性的分裂
基於序數屬性的劃分
基於連續屬性的劃分
怎樣選擇最佳劃分?
怎樣找到最佳劃分?
結點不純性的測量
不純性的測量: GINI
計算 GINI的例子
基於 GINI的劃分
二元屬性: 計算 GINI
標稱屬性:計算Gini
熵---定義
基於 Information Gain的劃分
計算 Entropy的例子
基於 Information Gain的劃分...
基於 Classification Error的劃分
例子
不純性度量之間的比較
停止分裂過程
三種著名的決策樹
子樹重複問題
決策邊界
斜決策樹
模型過分擬合和擬合不足
模型模型過分擬合和擬合不足
導致過分擬合的原因
噪聲導致的過分擬合(例子)
缺乏代表性樣本導致的過分擬合
過分擬合與多重比較
泛化誤差估計
結合模型複雜度
悲觀誤差評估
最小描述長度 (MDL)
使用確認集
處理決策樹中的過分擬合
處理決策樹中的過分擬合…
不平衡類問題
準確率的缺點
度量
ROC (Receiver Operating Characteristic)
使用ROC曲線比較模型
怎樣產生ROC曲線
..............................
用戶登陸
決策管理熱門資料
決策管理相關下載