计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (35): 153-155.
李星毅1,2,包从剑2,施化吉2,奚春海3
LI Xing-yi1,2,BAO Cong-jian2,SHI Hua-ji2,XI Chun-hai3
摘要: 聚类是数据挖掘领域中最活跃的研究分支之一,并在其他的科学领域也有广泛的应用。设计了基于加权快速聚类的异常数据挖掘算法,以便能快速发现异常数据。首先通过对数据的每个属性赋予一定权值,权值的大小要体现其对分类的贡献度,并根据属性权值的特点,选择比较优良的初始分区,然后进行多次迭代,得到接近最优分区,接着运用一定规则,发现异常数据类,最后实践证明该技术取得很好的社会效果。