試論基於信息論的數據挖掘方法(ppt 80頁)
試論基於信息論的數據挖掘方法(ppt 80頁)內容簡介
試論基於信息論的數據挖掘方法目錄:
一、信息論原理
二、信道模型
三、不確定性
四、互信息
五、互信息的計算
六、自信息定義
七、信息熵定義
八、舉例
九、討論
十、條件熵定義
十一、平均互信息量定義
十二、其他定義
十三、信息論在決策樹中的應用
十四、基於信息論的數據挖掘方法
十五、決策樹的方法
十六、決策樹的基本概念
……
試論基於信息論的數據挖掘方法內容提要:
決策樹的方法:
基本概念
ID3的基本思想和算法
ID3算法舉例
ID3算法的改進和討論
決策樹算法:
基本算法(貪心算法)
自上而下分而治之的方法
開始時,所有的數據都在根節點
屬性都是種類字段 (如果是連續的,將其離散化)
所有記錄用所選屬性遞歸的進行分割
屬性的選擇是基於一個啟發式規則或者一個統計的度量 (如, information gain)
停止分割的條件
一個節點上的數據都是屬於同一個類別
沒有屬性可以再用於對數據進行分割
..............................
用戶登陸
數據倉熱門資料
數據倉相關下載