计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (12): 37-45.DOI: 10.3778/j.issn.1002-8331.2102-0167
周玉,朱文豪,房倩,白磊
ZHOU Yu, ZHU Wenhao, FANG Qian, BAI Lei
摘要:
离群点检测在数据处理中具有重要研究意义,其检测方法大致可以分为基于统计、基于距离、基于密度和基于聚类的方法。为了及时掌握当前基于聚类技术的离群点检测方法的研究现状,通过归纳与整理,将具有代表性的基于聚类的离群点检测方法进行了介绍和归类,将其主要分为静态数据集中的检测方法、数据流中的检测方法、大规模数据中的检测方法和其他方法等四大类。对每类方法所解决的问题、算法思想、应用场景以及各自的优缺点进行了详细的归纳和分析,指出目前存在的问题以及未来发展方向。