计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (7): 141-146.DOI: 10.3778/j.issn.1002-8331.1509-0131
张 涛1,2,葛洪伟1,2,苏 辉1,2,张欢庆2
ZHANG Tao1, 2, GE Hongwei1, 2, SU Hui1, 2, ZHANG Huanqing2
摘要: 传统根据[K]-近邻图计算测地距离的方法,虽然能够发现流形分布数据间的相似关系,但是当不同类的点存在粘连关系时,依此计算相似度时不能体现样本间的真实关系,从而无法有效聚类。针对传统测地距离计算相似度的方法不能有效处理粘连数据集的问题,提出了基于局部密度和测地距离的谱聚类方法。计算样本的局部密度,寻找每个样本点的最近高密度点,并选择边缘点和非边缘点;在边缘点和其最近高密度点之间构造边、非边缘点之间的[K]个近邻点构造边,依此计算测地距离和相似度并进行聚类。在人工数据集和UCI数据集上的实验表明,该算法在处理粘连数据集时有效提高了聚类准确率。