數據挖掘決策樹的建立(PPT 23頁)
數據挖掘決策樹的建立(PPT 23頁)內容簡介
學習數據挖掘的工具-weka
天氣數據
ID3決策樹算法描述
信息值(熵)、信息增益的概念
ID3算法的不足及改進
C4.5算法做出的改進
C4.5算法的缺點
weka是用Java語言編寫的完整的軟件資源
Explorer是weka的主要圖形用戶界麵
weka存儲數據的原始方式是ARFF或CSV文件格式
ARFF文件是由一組實例組成,
並且每組實例的屬性值由逗號分開。(屬性的類別)
決策節點:
1.最上麵的節點稱為根節點,是整個決策樹的開始。
2.每個節點子節點的個數與決策樹在用的算法有關。(二叉樹、多叉樹)
分支:判斷過程,要麼是新的決策節點,要麼是葉子
樹葉:樹的結尾,每個葉子代表一個類別
..............................
天氣數據
ID3決策樹算法描述
信息值(熵)、信息增益的概念
ID3算法的不足及改進
C4.5算法做出的改進
C4.5算法的缺點
weka是用Java語言編寫的完整的軟件資源
Explorer是weka的主要圖形用戶界麵
weka存儲數據的原始方式是ARFF或CSV文件格式
ARFF文件是由一組實例組成,
並且每組實例的屬性值由逗號分開。(屬性的類別)
決策節點:
1.最上麵的節點稱為根節點,是整個決策樹的開始。
2.每個節點子節點的個數與決策樹在用的算法有關。(二叉樹、多叉樹)
分支:判斷過程,要麼是新的決策節點,要麼是葉子
樹葉:樹的結尾,每個葉子代表一個類別
..............................
下一篇:尚無數據
用戶登陸
決策管理熱門資料
決策管理相關下載