计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (28): 137-139.DOI: 10.3778/j.issn.1002-8331.2009.28.041
汪 军1,2,王传玉2,周鸣争1
WANG Jun1,2,WANG Chuan-yu2,ZHOU Ming-zheng1
摘要: K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止。提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均值聚类算法所需要的聚类数和初始聚类中心。在IRIS数据集上的实验表明,尽管随机样本构造的生成树不同,聚类中心也不同,但聚类是一致且稳定的,迭代的次数较少,验证了该文算法的有效性。
中图分类号: