计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (3): 115-117.DOI: 10.3778/j.issn.1002-8331.2010.03.034
童先群,周忠眉
TONG Xian-qun,ZHOU Zhong-mei
摘要: 为了克服传统KNN算法,距离加权-KNN算法在距离定义及投票方式上的不足,提出了一种基于属性值对类别重要性的改进算法Entropy-KNN。首先定义两个样本间的距离为相同属性值的平均信息熵,此距离可通过重要属性值有效度量样本之间的相似程度,其次算法Entropy-KNN根据上述定义的距离选取与待测试样本距离最小的K个近邻,最后根据各类近邻样本点的平均距离及个数判断待测试样本的类别。在蘑菇数据集上的实验表明,Entropy-KNN算法的分类准确率高于传统KNN算法和距离加权KNN算法。
中图分类号: