计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (16): 50-54.DOI: 10.3778/j.issn.1002-8331.1907-0334
马克勤,杨延娇,秦红武,耿琳,王丕栋
MA Keqin, YANG Yanjiao, QIN Hongwu, GENG Lin, WANG Pidong
摘要:
随机选取初始聚类中心和根据经验设置[K]值对[K]-means聚类结果都有一定的影响,针对这一问题,提出了一种基于加权密度和最大最小距离的[K]-means聚类算法,称为[KWDM]算法。该算法利用加权密度法选取初始聚类中心点集,减少了离群点对聚类结果的影响,通过最大最小距离准则启发式地选择聚类中心,避免了聚类结果陷入局部最优,最后使用准则函数即簇内距离和簇间距离的比值来确定[K]值,防止了根据经验来设置[K]值。在人工数据集和UCI数据集上的实验结果表明,KWDM算法不仅提高了聚类的准确率,而且减少了算法的平均迭代次数,增强了算法的稳定性。