计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (15): 48-52.DOI: 10.3778/j.issn.1002-8331.1706-0223
周本金,陶以政,纪 斌,谢永辉
ZHOU Benjin, TAO Yizheng, JI Bin, XIE Yonghui
摘要: 传统的k-均值算法对初始聚类中心和孤立点敏感,文中以最大程度地减少误差平方和为基本思想,提出一种最大化减少当前误差平方和的k-means初始聚类中心优化方法。在初始聚类中心选择阶段,每次增加聚类中心时,计算所有数据点作为当前聚类中心能够减少的误差平方和,选择能够最大化减少误差平方和的数据点作为聚类初始中心。利用真实数据集,同其他算法进行对比,实验结果表明该方法在选择初始聚类中心方面能够有效地减少聚类的迭代次数,提高聚类质量。同时人工模拟数据表明该方法对孤立点相对不敏感。