计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (11): 155-157.
钱光超,贾瑞玉,张 然,李龙澍
QIAN Guang-chao,JIA Rui-yu,ZHANG Ran,LI Long-shu
摘要: 离群点检测是数据挖掘一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法。对离群数据挖掘几类主要的方法进行了分析和评价,并在此基础上了提出了一种基于遗传聚类的离群点检测算法。该算法结合了遗传算法全局搜索的优点和K-均值方法局部收敛速度快的特点,取得较好效果。实验验证该算法很好地检测到数据集中的离群点,同时还完成了数据集的聚类。具有较好的实用性。