您現在的位置: 18luck新利全站下载 >> 企業管理>> 決策管理>> 資料信息

決策樹算法在商標分類中的應用(doc 6頁)

所屬分類:
決策管理
文件大小:
245 KB
下載地址:
相關資料:
決策樹算法, 商標分類
決策樹算法在商標分類中的應用(doc 6頁)內容簡介
決策樹算法在商標分類中的應用內容提要:
決策樹方法是挖掘分類規則的有效方法,通常包括兩個部分:①樹的生成,開始時所有的數據都在根節點,然後根據設定的標準選擇測試屬性,
用不同的測試屬性遞歸進行數據分割。②樹的修剪,就是除去一些可能是噪音或異常的數據。基於信息熵的ID3算法、C4.5算法都能有效地生成決策樹,建決策樹的關鍵在於建立分支時對記錄字段不同取值的選擇。選擇不同的字段值使劃分出來的記錄子集不同影響決策樹生長的快慢及決策樹的結構,從而可尋找到規則信息的優劣。可見,決策樹算法的技術難點就是選擇一個好的分支取值。利用好的取值產生分支可加快決策樹的生長,更重要是產生好結構的決策樹,並可得到較好的規則信息。相反,若根據一個差的取值產生分支,不但減慢決策樹的生長速度,而且使產生的決策樹分支過細、結構差,從而難以發現有用的規則信息。隨著訓練樣本集中樣本個數的不斷增多(即樣本集規模不斷擴大),訓練樣本集在主存中換進換出就耗費了大量的時間,嚴重影響了算法效率。因此使算法能有效處理大規模的訓練樣本集已成為決策樹算法研究的一個重要問題,也是目前國內對決策樹算法研究的熱點。本文利用決策樹C4.5算法來解決圖像的分類問題。

..............................

Baidu
map