计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (2): 148-153.DOI: 10.3778/j.issn.1002-8331.1710-0059
朱庆峰1,2,葛洪伟1,2
ZHU Qingfeng1,2, GE Hongwei1,2
摘要: 针对密度峰聚类分配时,仅考虑样本点与指向点(密度比它大的最近点)之间的距离,不适用于流形聚类(如Circleblock数据集、Lineblobs数据集等)的问题,提出了[K]近邻相似度优化的密度峰聚类算法。在计算每个点的密度与指向点后,通过相似度函数,找出每个点的[K]近邻,然后根据[K]近邻信息判断样本点的指向点是否正确,对于指向错误的点重新寻找正确的指向点,可以有效减少错误分配。在人工数据集和UCI数据集上的实验表明,新算法具有更高的准确率。