计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (28): 133-135.DOI: 10.3778/j.issn.1002-8331.2008.28.045
贾俊芳,张日权
JIA Jun-fang,ZHANG Ri-quan
摘要: 为了提高聚类效率提出了一种基于分布式的大数据集聚类算法。该方法并不是一次性对所有的数据进行聚类,而是将大数据集随机分成若干个子集,对每个子集同时进行聚类,最后进行类的合并。实验结果表明大多数情况下该方法和传统的一次性聚类的结果一致,而且极大地提高了聚类的速度。