面向文本分类的多头注意力池化RCNN模型

doi:10.3778/j.issn.1002-8331.2003-0276

计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (12): 155-160.DOI: 10.3778/j.issn.1002-8331.2003-0276

面向文本分类的多头注意力池化RCNN模型

翟一鸣，王斌君，周枝凝，仝鑫

中国人民公安大学警务信息工程与网络安全学院，北京 100038

出版日期:2021-06-15 发布日期:2021-06-10

Multi-head Attention Pooling-Based RCNN Model for Text Classification

ZHAI Yiming, WANG Binjun, ZHOU Zhining, TONG Xin

College of Police Information Engineering and Cyber Security, People’s Public Security University of China, Beijing 100038, China

Online:2021-06-15 Published:2021-06-10

摘要/Abstract

摘要：

针对经典循环卷积神经网络（RCNN）在池化层采用的最大池化策略较为单一，会忽略除最突出特征外的其他特征，影响分类精度的问题，提出基于多头注意力池化的循环卷积神经网络（MHAP-RCNN）模型。多头注意力池化可以充分考虑各特征对分类的贡献，且能在训练过程中动态优化，有效缓解最大池化的单一性问题。在三个公开的文本分类数据集上进行实验，结果表明与经典RCNN及其他各模型相比，提出的模型具有更好的文本分类性能。

关键词: 文本分类, 循环卷积神经网络, 池化, 最大池化, 多头注意力池化

Abstract:

The strategy of max pooling in the pooling layer adopted by classic Recurrent Convolutional Neural Network（RCNN） is relatively onefold, which will ignore other features except the most prominent one and affect the classification accuracy. Therefore, a Multi-Head Attention Pooling-based Recurrent Convolutional Neural Network（MHAP-RCNN） is proposed. The mechanism of multi-head attention pooling can fully consider the contribution of each feature to classification, and can be dynamically optimized in the training process, which can effectively alleviate the above problem of max pooling. Experiments are performed on three public text classification data sets. The results show that the proposed model has better performance on text classification than classic RCNN and other models.

Key words: text classification, recurrent convolutional neural network, pooling, max pooling, multi-head attention pooling

翟一鸣，王斌君，周枝凝，仝鑫. 面向文本分类的多头注意力池化RCNN模型[J]. 计算机工程与应用, 2021, 57(12): 155-160.

ZHAI Yiming, WANG Binjun, ZHOU Zhining, TONG Xin. Multi-head Attention Pooling-Based RCNN Model for Text Classification[J]. Computer Engineering and Applications, 2021, 57(12): 155-160.

[1]	霍光煜，张勇，孙艳丰，尹宝才. 基于语义的档案数据智能分类方法研究[J]. 计算机工程与应用, 2021, 57(6): 247-253.
[2]	黄金杰，蔺江全，何勇军，何瑾洁，王雅君. 局部语义与上下文关系的中文短文本分类算法[J]. 计算机工程与应用, 2021, 57(6): 94-100.
[3]	郑诚，董春阳，黄夏炎. 基于BTM图卷积网络的短文本分类方法[J]. 计算机工程与应用, 2021, 57(4): 155-160.
[4]	贺文亮，朱敏玲. 胶囊神经网络研究现状与未来的浅析[J]. 计算机工程与应用, 2021, 57(3): 33-43.
[5]	滕金保，孔韦韦，田乔鑫，王照乾，李龙. 基于CNN和LSTM的多通道注意力机制文本分类模型[J]. 计算机工程与应用, 2021, 57(23): 154-162.
[6]	李代栋，赫晓慧，李盼乐，田智慧，周广胜. 基于SPUD-ResNet的遥感影像道路提取网络[J]. 计算机工程与应用, 2021, 57(23): 240-247.
[7]	武书钊，李功权，卜明伟. 基于知识图谱的自杀倾向检测问答系统构建[J]. 计算机工程与应用, 2021, 57(22): 304-312.
[8]	徐健，黄磊，陈倩倩，陆珍，吴曙培. 基于多尺度特征迁移学习的步态识别研究[J]. 计算机工程与应用, 2021, 57(20): 180-187.
[9]	张宏丽，白翔宇. 利用优化剪枝GoogLeNet的人脸表情识别方法[J]. 计算机工程与应用, 2021, 57(19): 179-188.
[10]	李铁飞，生龙，吴迪. BERT-TECNN模型的文本分类方法研究[J]. 计算机工程与应用, 2021, 57(18): 186-193.
[11]	丁勇，程家桥，蒋翠清，王钊. 基于主题和关键词特征的比较文本分类方法[J]. 计算机工程与应用, 2021, 57(17): 196-202.
[12]	滕金保，孔韦韦，田乔鑫，王照乾. 基于LSTM-Attention与CNN混合模型的文本分类方法[J]. 计算机工程与应用, 2021, 57(14): 126-133.
[13]	姚佳奇，徐正国，燕继坤，王科人. GCN-PU:基于图卷积网络的PU文本分类算法[J]. 计算机工程与应用, 2021, 57(11): 162-167.
[14]	申艳光，贾耀清. 基于词共现与图卷积的文本分类方法[J]. 计算机工程与应用, 2021, 57(11): 173-178.
[15]	郝超，裘杭萍，孙毅，张超然. 多标签文本分类研究进展[J]. 计算机工程与应用, 2021, 57(10): 48-56.

面向文本分类的多头注意力池化RCNN模型

Multi-head Attention Pooling-Based RCNN Model for Text Classification

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics