计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (19): 76-79.
陈慧萍1,林莉莉1,王建东2,苗新蕊1
CHEN Hui-ping1,LIN Li-li1,WANG Jian-dong2,MIAO Xin-rui1
摘要: 在开源数据挖掘平台WEKA上进行了挖掘测试和分析,并分析了其存在的主要问题。为了克服WEKA系统在聚类方面的薄弱性,在WEKA的开源环境下进行二次开发,扩充了聚类算法。介绍了将k-中心点轮换算法嵌入到WEKA平台的过程,充分利用了开源WEKA中的类和可视化功能,并对嵌入的算法和原有聚类算法进行了对比分析。该算法改进了传统的k-中心点算法,避免陷入局部最优,而且它对初始点不太敏感,可以获取更好的聚类效果。