您現在的位置: 18luck新利全站下载 >> 管理信息化>> 數據倉>> 資料信息

試論基於信息論的數據挖掘方法(ppt 80頁)

所屬分類:
數據倉
文件大小:
1595 KB
下載地址:
相關資料:
信息論, 數據挖掘
試論基於信息論的數據挖掘方法(ppt 80頁)內容簡介

試論基於信息論的數據挖掘方法目錄:
一、信息論原理
二、信道模型
三、不確定性
四、互信息
五、互信息的計算
六、自信息定義
七、信息熵定義
八、舉例
九、討論
十、條件熵定義
十一、平均互信息量定義
十二、其他定義
十三、信息論在決策樹中的應用
十四、基於信息論的數據挖掘方法
十五、決策樹的方法
十六、決策樹的基本概念
……


試論基於信息論的數據挖掘方法內容提要:
決策樹的方法:
基本概念
ID3的基本思想和算法
ID3算法舉例
ID3算法的改進和討論
決策樹算法:
基本算法(貪心算法)
自上而下分而治之的方法
開始時,所有的數據都在根節點
屬性都是種類字段 (如果是連續的,將其離散化)
所有記錄用所選屬性遞歸的進行分割
屬性的選擇是基於一個啟發式規則或者一個統計的度量 (如, information gain)
停止分割的條件
一個節點上的數據都是屬於同一個類別
沒有屬性可以再用於對數據進行分割


..............................

Baidu
map