计算机工程与应用 ›› 2022, Vol. 58 ›› Issue (3): 172-180.DOI: 10.3778/j.issn.1002-8331.2104-0258
杨兴锐,赵寿为,张如学,杨兴俊,陶叶辉
YANG Xingrui, ZHAO Shouwei, ZHANG Ruxue, YANG Xingjun, TAO Yehui
摘要: 双向长短期记忆网络(BiLSTM)和卷积神经网络(CNN)很难在文本的多分类任务中提取到足够的文本信息。提出了一种基于自注意力机制(self_attention)和残差网络(ResNet)的BiLSTM_CNN复合模型。通过自注意力赋予卷积运算后信息的权重,接着将池化后的特征信息层归一化并接入残差网络,让模型学习到残差信息,从而进一步提高模型的分类性能。在模型的运算过程中,使用了更加光滑的Mish非线性激活函数代替Relu。通过与深度学习模型对比,所提出的方法在准确率以及F1值评价指标上均优于现有模型,为文本分类问题提供了新的研究思路。