计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (13): 139-141.DOI: 10.3778/j.issn.1002-8331.2010.13.041
巩 固1,黄永青1,郝国生1,2
GONG Gu1,HUANG Yong-qing1,HAO Guo-sheng1,2
摘要: 针对决策树C4.5/5.0分类算法及改进的算法在创建决策树时训练误差率和校验误差率相对较高的缺点,提出一些改进策略,即利用属性相关性进行属性约简与度量以达到解决属性集合中的冗余属性,采用一定置信度值进行决策树的修剪,采用优化的Chi2算法更合理更准确地对连续属性进行离散化,基于改进策略设计并实现一个分类器,将改进的算法应用于Breast-cancer实例,实验结果证明改进的算法生成的决策树具有较高的分类正确率。
中图分类号: