计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (28): 136-139.DOI: 10.3778/j.issn.1002-8331.2008.28.046
陈园园1,陈治平1,2
CHEN Yuan-yuan1,CHEN Zhi-ping1,2
摘要: 针对基于密度的聚类方法不能发现密度分布不均的数据样本的缺陷,提出了一种基于代表点和点密度的聚类算法。算法通过检查数据库中每个点的k近邻来寻找聚类。首先选取一个种子点作为类的第一个代表点,其k近邻为其代表区域,如果代表区域中的点密度满足密度阈值,则将该点作为一个新的代表点,如此反复地寻找代表点,这些区域相连的代表点及其代表区域将构成一个聚类。实验结果表明,该算法能够发现任意形状、大小和密度的聚类。