计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (16): 85-89.
赵湘民1,2,陈 曦1,潘 楚3
ZHAO Xiangmin1,2, CHEN Xi1, PAN Chu3
摘要: 针对传统K-medoids聚类算法对初始中心点敏感,以及迭代次数较高等缺点,提出一种可行的初始化方法和中心点搜索更新策略。新算法首先利用密度可达思想为数据集中每个对象建立一个稠密区域,遴选出[K]个密度大且距离较远的稠密区域,把对应的稠密区域的核心对象作为聚类算法的[K]个初始中心点;其次,把[K]个中心点搜索更新范围锁定在所选的[K]个有效稠密区域里。新算法在Iris、Wine、PId标准数据集中测试,获取了理想中心点和稠密区域,并且在较少的迭代次数内收敛到最优解或近似最优解。