计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (19): 7-11.
李少波1,2,孟 伟1,璩晶磊1
LI Shaobo1,2, MENG Wei1, QU Jinglei1
摘要: 为改善有关数据流的异常数据检测方法中存在的检测准确度低和执行效率低等问题,根据数据挖掘技术理论,提出了一种新的基于密度的异常数据检测算法GSWCLOF。该算法引入滑动时间窗口和网格的理念,在滑动时间窗口内利用网格将数据细分,同时利用信息熵对所有网格内的数据进行剪枝和筛选,从而剔除绝大部分正常的数据,最后再利用离群因子对剩下的数据进行最终判断。实验结果表明,该算法有效地提高了检测准确度和执行效率。