计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (16): 134-137.DOI: 10.3778/j.issn.1002-8331.1701-0261
宋奎勇1,2,王念滨1,王红滨1,寇香霞2
SONG Kuiyong1,2, WANG Nianbin1, WANG Hongbin1, KOU Xiangxia2
摘要: 针对传统距离度量在高维数据上效果不明显问题,提出一种共享最近邻子空间聚类算法(SNN_SC),按照维把数据集转变为多个最近邻事务数据库,挖掘事务数据库中最大共现对象集,即一维上聚类。在一维聚类集上进一步挖掘闭频繁项集,包含闭频繁项集的维是子空间,闭频繁项集是子空间上聚类。实验对比结果表明,SNN_SC能够更准确定位子空间,并在子空间上产生完整聚类。