计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (16): 74-81.DOI: 10.3778/j.issn.1002-8331.2205-0036
罗兴隆,贺兴时,杨新社
LUO Xinglong, HE Xingshi, YANG Xinshe
摘要: 光谱聚类(spectral clustering,SC)由于在无监督学习中的有效性而受到越来越多的关注。然而其计算复杂度高,不适用于处理大规模数据。近年来提出了许多基于锚点图方法来加速大规模光谱聚类,然而这些方法选取的锚点通常不能很好地体现原始数据的信息,从而导致聚类性能下降。为克服这些缺陷,提出了一种二分[k]-means锚点提取的快速谱聚类算法(fast spectral clustering algorithm based on anchor point extraction with bisecting [k]-means,FCAPBK)。该方法利用二分[k]-means从原始数据中选取一些具有代表性的锚点,构建基于锚点的多层无核相似图;然后通过锚点与样本间的相似关系构造层次二部图。最后在5个基准数据集上分别进行实验验证,结果表明FCAPBK方法能够在较短的时间内获得良好的聚类性能。