计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (17): 93-99.DOI: 10.3778/j.issn.1002-8331.1908-0298
张常华,周雄图,张永爱,姚剑敏,郭太良,严群
ZHANG Changhua, ZHOU Xiongtu, ZHANG Yong’ai, YAO Jianmin, GUO Tailiang, YAN Qun
摘要:
针对自编码器网络(AE)需要正常数据进行训练的局限性,结合主成分分析方法,将AE的每次重建输出与输入数据进行求差,隔离出异常数据部分,即将输入数据分为正常与异常部分,正常部分由AE重建输出,异常部分由近端法进行优化输出,最后采用交替方向乘子法训练整个模型并达到预定训练次数再输出结果,实现了一种基于深度自编码网络(DAE)模型的无监督数据异常检测方法。在7个真实数据集与8种机器学习模型和AE模型进行了对比实验,结果表明,DAE模型无需输入正常数据就可以有效进行模型训练,且可以防止模型的过拟合,其综合表现高于传统机器学习模型和AE模型,AUC值在4个数据集中达到最优。在mnist数据集中,DAE模型的AUC值相比于孤立森林(IF)方法提高了10.93%。