计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (12): 84-93.DOI: 10.3778/j.issn.1002-8331.2203-0161
马振明,安俊秀,周俊
MA Zhenming, AN Junxiu, ZHOU Jun
摘要: 密度峰值聚类(DPC)是简单有效的聚类算法,但该算法存在假设与实现间不一致和假设不适用的问题,导致DPC在密度不均的数据集上很难确定中心点,且非中心点分配策略鲁棒性低并产生连锁反应。针对此,提出一种结合混合密度和局部结构的密度峰值聚类算法(HS-DPC)。利用相对密度和绝对密度,提出混合密度计算公式,消除DPC假设中心点为局部峰值,但算法实现是全局峰值间的不一致。根据局部结构重新定义数据点之间的相似性,从而适应形状复杂数据。对中心点依据相似性传递,搜索有效数据并形成簇的主干结构。对剩余点结合不同簇的主干点分布进行距离最优分配,隔绝连锁反应完成边界聚类。通过在16个数据集上与五种聚类算法进行对比实验,结果表明了HS-DPC的有效性和鲁棒性。