计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (21): 156-159.DOI: 10.3778/j.issn.1002-8331.2010.21.044
杨 仪,向长城,魏代俊
YANG Yi,XIANG Chang-cheng,WEI Dai-jun
摘要: 针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN)。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。
中图分类号: