數據挖掘技術概述講義(ppt 182頁)
數據挖掘技術概述講義(ppt 182頁)內容簡介
分類和預測
分類
分類數據
決策表實例
決策樹
使用決策樹進行分類
決策樹算法
屬性選擇的統計度量
信息增益度度量(ID3/C4.5)
訓練集
使用信息增益進行屬性選擇
決策樹在犯罪分析中的應用
犯罪潛在風險決策樹
基尼指數(Gini Index)
過擬合問題
Pruning Tree
誤分類率
決策樹算法的可伸縮性
常用的決策樹算法
CART算法
評估分類算法的準確性
神經網絡
神經網絡的組成
典型的多層前饋神經網絡
BP神經網絡的訓練(1)
BP神經網絡的訓練(2)
神經網絡的應用(1)
神經網絡的應用(2)
貝葉斯分類器
貝葉斯定理
樸素貝葉斯分類器
貝葉斯分類器在供電電容生產中的應用(1)
貝葉斯分類器在供電電容生產中的應用(2)
貝葉斯分類器在垃圾郵件處理中的應用
聚類Clustering
聚類
聚類分析
發現客戶的特征
與分類的區別
聚類問題的數學描述
基本概念
聚類需求
計算對象之間的相異度
Similarity and Dissimilarity
二元變量
二元變量的相異度計算
標稱變量(Nominal Variables)
序數型變量
聚類算法
K-均值算法(1)
K-均值算法過程
K-均值算法(2)
K-均值算法性質
K-均值算法局限
K-means算法在中藥種植區域劃分中的應用
聚類結果
k-means算法在安全檢測中的應用
聚類結果
k-modes算法
k-modes算法過程
k-prototypes算法
其他聚類方法
基於密度的聚類
DBSCAN 算法
聚類可視化
聚類結果 –信用卡用戶聚類
聚類結果 – 高花費用戶
聚類的典型應用
偏離(異常)檢測
偏離檢測
異常探測
啤酒和尿布問題
購物籃分析
什麼是關聯挖掘?
關聯規則問題的形式化描述項目
支持度和置信度
強關聯規則
關聯規則挖掘問題的分解
強關聯規則的產生
規則度量:支持度與可信度
關聯規則挖掘:路線圖
關聯規則挖掘例子
Apriori算法
項集格
如何生成候選集
生成候選集的例子
Apriori算法例子
Apriori 算法在超市的應用
IBM DB2 Intelligent Miner構建關聯模型
Apriori 性能瓶頸
布爾型和數值型關聯規則
多層關聯規則
挖掘多層關聯規則
多層關聯:冗餘過濾
多維關聯規則概念
分離關聯規則
FP增長算法
構造FP樹
利用FP樹產生頻繁項集
其他關聯規則挖掘算法
序列模式分析
序列模式
序列模式應用例子
序列模式挖掘的主要算法
GSP算法的主要問題
GSP算法
候選序列模式步驟
序列模式挖掘實例
顧客購物序列模式挖掘
其他序列模式挖掘算法
序列模式應用領域
時間序列挖掘Time Series Mining
時間序列
時間序列應用領域
某公司季度淨利潤的趨勢
時間序列幾種基本運動
主要的時間序列分析模型
相似性搜索
相似時間序列
時間序列參數
需要注意的問題
回歸分析Regression
回歸分析的步驟
回歸模型
線性回歸
回歸預測
一元回歸分析應用
應用logistic回歸模型預測銀行顧客是否拖欠貸款
推薦資料(IBM紅皮書)
..............................
分類
分類數據
決策表實例
決策樹
使用決策樹進行分類
決策樹算法
屬性選擇的統計度量
信息增益度度量(ID3/C4.5)
訓練集
使用信息增益進行屬性選擇
決策樹在犯罪分析中的應用
犯罪潛在風險決策樹
基尼指數(Gini Index)
過擬合問題
Pruning Tree
誤分類率
決策樹算法的可伸縮性
常用的決策樹算法
CART算法
評估分類算法的準確性
神經網絡
神經網絡的組成
典型的多層前饋神經網絡
BP神經網絡的訓練(1)
BP神經網絡的訓練(2)
神經網絡的應用(1)
神經網絡的應用(2)
貝葉斯分類器
貝葉斯定理
樸素貝葉斯分類器
貝葉斯分類器在供電電容生產中的應用(1)
貝葉斯分類器在供電電容生產中的應用(2)
貝葉斯分類器在垃圾郵件處理中的應用
聚類Clustering
聚類
聚類分析
發現客戶的特征
與分類的區別
聚類問題的數學描述
基本概念
聚類需求
計算對象之間的相異度
Similarity and Dissimilarity
二元變量
二元變量的相異度計算
標稱變量(Nominal Variables)
序數型變量
聚類算法
K-均值算法(1)
K-均值算法過程
K-均值算法(2)
K-均值算法性質
K-均值算法局限
K-means算法在中藥種植區域劃分中的應用
聚類結果
k-means算法在安全檢測中的應用
聚類結果
k-modes算法
k-modes算法過程
k-prototypes算法
其他聚類方法
基於密度的聚類
DBSCAN 算法
聚類可視化
聚類結果 –信用卡用戶聚類
聚類結果 – 高花費用戶
聚類的典型應用
偏離(異常)檢測
偏離檢測
異常探測
啤酒和尿布問題
購物籃分析
什麼是關聯挖掘?
關聯規則問題的形式化描述項目
支持度和置信度
強關聯規則
關聯規則挖掘問題的分解
強關聯規則的產生
規則度量:支持度與可信度
關聯規則挖掘:路線圖
關聯規則挖掘例子
Apriori算法
項集格
如何生成候選集
生成候選集的例子
Apriori算法例子
Apriori 算法在超市的應用
IBM DB2 Intelligent Miner構建關聯模型
Apriori 性能瓶頸
布爾型和數值型關聯規則
多層關聯規則
挖掘多層關聯規則
多層關聯:冗餘過濾
多維關聯規則概念
分離關聯規則
FP增長算法
構造FP樹
利用FP樹產生頻繁項集
其他關聯規則挖掘算法
序列模式分析
序列模式
序列模式應用例子
序列模式挖掘的主要算法
GSP算法的主要問題
GSP算法
候選序列模式步驟
序列模式挖掘實例
顧客購物序列模式挖掘
其他序列模式挖掘算法
序列模式應用領域
時間序列挖掘Time Series Mining
時間序列
時間序列應用領域
某公司季度淨利潤的趨勢
時間序列幾種基本運動
主要的時間序列分析模型
相似性搜索
相似時間序列
時間序列參數
需要注意的問題
回歸分析Regression
回歸分析的步驟
回歸模型
線性回歸
回歸預測
一元回歸分析應用
應用logistic回歸模型預測銀行顧客是否拖欠貸款
推薦資料(IBM紅皮書)
..............................
用戶登陸
bi商務智能熱門資料
bi商務智能相關下載