计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (20): 103-110.DOI: 10.3778/j.issn.1002-8331.2209-0093
宋中山,牛悦,郑禄,帖军,姜海
SONG Zhongshan, NIU Yue, ZHENG Lu, TIE Jun, JIANG Hai
摘要: 针对双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)和卷积神经网络(convolution neural network,CNN)因各自模型提取特征的局限性导致的分类准确率不高的问题,提出一种改进的双层CNN网络和引入注意力机制的BiLSTM联合模型。由于单层CNN网络获取局部特征能力有限,该模型通过对多尺度组合卷积引入上采样与原始文本进行跳跃连接来增强后续卷积的局部感受野,以达到增强特征提取丰富语义的目的。同时对BiLSTM模型引入注意力机制使之将注意力关注到重点单词特征上,将改进后的CNN网络和BiLSTM模型进行特征融合,最后输入全连接层进行多分类任务。模型在2个公开的中文新闻分类数据集上进行实验,实验结果显示所提出的模型在公开数据集THUCNews上的准确率为93.62%,比单通道普通CNN模型提高3.01个百分点,比CNN-LSTM双通道模型提高2.2个百分点。