计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (15): 142-144.
李 勃1,王艳兵2,姚 青2
LI Bo1,WANG Yan-bing2,YAO Qing2
摘要: 数据挖掘是人工智能中知识发现的重要组成部分,而分类又是一种主要的应用形式。ID3算法是数据挖掘中经典的决策树分类算法,ID3算法具有抗噪声能力差的缺点。通过对分类和粗糙集理论的研究,将可变精度粗糙集理论的思想应用在计算属性信息熵时设定阈值上,以放宽属性选择的要求,从而对经典的ID3算法作了相应的改进。改进后的ID3算法(称之为VPID3算法)可在一定程度上降低噪声对系统分类的干扰,提高了有数据有噪声情况下的分类精度。另外根据该算法设计并实现了一个分类器,并通过实验检验了该算法的性能。