计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (14): 126-133.DOI: 10.3778/j.issn.1002-8331.2011-0037
滕金保,孔韦韦,田乔鑫,王照乾
TENG Jinbao, KONG Weiwei, TIAN Qiaoxin, WANG Zhaoqian
摘要:
针对传统长短时记忆网络(Long Short-Term Memory,LSTM)和卷积神经网络(Convolution Neural Network,CNN)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于LSTM-Attention与CNN混合模型的文本分类方法。使用CNN提取文本局部信息,进而整合出全文语义;用LSTM提取文本上下文特征,在LSTM之后加入注意力机制(Attention)提取输出信息的注意力分值;将LSTM-Attention的输出与CNN的输出进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上。在三个公开数据集上的实验结果表明,提出的模型相较于LSTM、CNN及其改进模型效果更好,可以有效提高文本分类的效果。