计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (14): 103-109.DOI: 10.3778/j.issn.1002-8331.2004-0209
顾兆军,杨文瑾,周景贤
GU Zhaojun, YANG Wenjin, ZHOU Jingxian
摘要:
域名生成算法(DGA)存在变化多、部分类别样本难获取的特点,使得采用传统机器学习的恶意域名检测模型准确性不高。提出一种基于迁移学习和多核CNN的小样本DGA恶意域名检测模型。该模型将目标域名映射到向量空间中,使用样本充足的DGA种类进行预训练,并迁移预训练得到的参数到小样本检测模型。采用多核CNN小样本分类模型根据发音习惯进行域名特征提取并分类。通过实验对比发现,无知识迁移的小样本分类模型只有11类域名准确率超过92%,经过迁移学习的多核CNN模型20类准确率超过92%,11类准确率超过97%,检测效果接近数据充足时的分类效果。