计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (14): 251-259.DOI: 10.3778/j.issn.1002-8331.2203-0127
房国庆,张雅娴,于丹,马垚,陈永乐
FANG Guoqing, ZHANG Yaxian, YU Dan, MA Yao, CHEN Yongle
摘要: 工业控制系统面临着严峻的安全威胁,基于机器学习的入侵检测技术依赖大量的标注数据,但工业控制系统标注数据匮乏且通信协议众多,不同通信协议下的数据不通用。为了解决上述问题,提出了一种时序敏感的跨协议域混淆工控入侵检测模型(timing-sensitive cross-protocol domain confusion industrial control intrusion detection model,TCPDC)。该模型利用迁移学习的域混淆技术最小化不同通信协议下流量数据的分布差异,把在旧的通信协议下学习到的知识迁移到新的通信协议下,仅利用新的通信协议下的少量未标注数据,即可构建出高准确率的入侵检测模型。除此之外,为了实现攻击数据的细粒度识别,该模型利用长短期记忆网络(long short-term memory,LSTM)算法提取流量数据的时间序列特征,以检测更加隐蔽的攻击。TCPDC在Electra数据集上评估性能,实验结果证明了迁移学习在跨协议构建入侵检测模型方面的可行性和有效性。