基于弱监督预训练CNN模型的情感分析方法

doi:10.3778/j.issn.1002-8331.1804-0208

计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (13): 27-33.DOI: 10.3778/j.issn.1002-8331.1804-0208

基于弱监督预训练CNN模型的情感分析方法

张越1，2，夏鸿斌1，2

1.江南大学数字媒体学院，江苏无锡 214122
2.江苏省媒体设计与软件技术重点实验室，江苏无锡 214122

出版日期:2018-07-01 发布日期:2018-07-17

Sentiment analysis method based on pre-training Convolutional Neural Networks by distant supervision

ZHANG Yue1，2， XIA Hongbin1，2

1.School of Digital Media, Jiangnan University, Wuxi, Jiangsu 214122, China
2.Jiangsu Key Laboratory of Media Design and Software Technology, Wuxi, Jiangsu 214122, China

Online:2018-07-01 Published:2018-07-17

摘要/Abstract

摘要： 传统的情感分析研究大多基于机器学习算法，此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示，进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题，利用大规模弱监督数据来训练卷积神经网络。同时引入“预训练-微调”策略，先在弱监督数据集上对卷积神经网络进行预训练，然后使用监督数据集进行微调训练来克服弱监督数据中的噪声问题。在SemEval-2013 Twitter情感分析数据集上进行实验验证，结果表明由于引入了弱监督数据参与训练，有效增强了卷积神经网络学习情感语义的能力，从而提升了模型的准确性。

关键词: 情感分析, 弱监督, 预训练-微调, 卷积神经网络

Abstract: Traditional researches of sentiment analysis are mostly based on machine learning algorithm, which rely on a huge number of artificially extracted features and domain knowledge. Convolution neural network is used to automatically learn the characteristics of texts and then identify the sentiment polarity of them. In order to solve the problem of insufficient supervision training dataset in sentiment analysis, the large-scale distant supervision data the used to train convolution neural network. At the same time, the “pre-train-fine-tune” strategy is used to overcome the noises in the distant supervision data, by pre-training convolution neural network on the distant supervision data and then fine-tuning it on the supervision dataset. Experimental results on the SemEval-2013 Twitter sentiment analysis dataset show that the ability of convolutional neural network to learn emotion semantics is enhanced effectively by using distant supervision data to participate in the training.

Key words: sentiment analysis, distant supervision, pre-train-fine-tune, Convolutional Neural Networks（CNN）

张越1，2，夏鸿斌1，2. 基于弱监督预训练CNN模型的情感分析方法[J]. 计算机工程与应用, 2018, 54(13): 27-33.

ZHANG Yue1，2， XIA Hongbin1，2. Sentiment analysis method based on pre-training Convolutional Neural Networks by distant supervision[J]. Computer Engineering and Applications, 2018, 54(13): 27-33.

[1]	冉蓉，徐兴华，邱少华，崔小鹏，欧阳斌. 基于深度卷积神经网络的裂纹检测方法综述[J]. 计算机工程与应用, 2021, 57(9): 23-35.
[2]	牟清萍，张莹，张东波，王新杰，杨知桥. 目标丢失判别机制的视觉跟踪算法及应用研究[J]. 计算机工程与应用, 2021, 57(9): 140-147.
[3]	包志强，邢瑜，吕少卿，黄琼丹. 改进YOLO V2的6D目标姿态估计算法[J]. 计算机工程与应用, 2021, 57(9): 148-153.
[4]	赵志焱，杨华，胡志伟，宇海萍. 基于TACNN的玉露香梨叶虫害识别[J]. 计算机工程与应用, 2021, 57(9): 176-181.
[5]	周伦钢，孙怡峰，王坤，吴疆，黄维贵，李炳龙. 目标多种多值属性的端端快速识别网络[J]. 计算机工程与应用, 2021, 57(9): 182-190.
[6]	张成，戴俊峰，熊闻心. 融合LeNet-5改进的扫描文档手写日期识别[J]. 计算机工程与应用, 2021, 57(9): 207-211.
[7]	麻哲旭，杨峰，乔旭. 铁路路基病害智能检测方法[J]. 计算机工程与应用, 2021, 57(9): 272-278.
[8]	张越，黄友锐，刘鹏坤. 引入注意力机制的多分辨率人体姿态估计研究[J]. 计算机工程与应用, 2021, 57(8): 126-132.
[9]	李现国，冯欣欣，李建雄. 多尺度残差网络的单幅图像超分辨率重建[J]. 计算机工程与应用, 2021, 57(7): 215-221.
[10]	梁芳烜，杨锋，卢丽云，尹梦晓. 基于卷积神经网络的脑肿瘤分割方法综述[J]. 计算机工程与应用, 2021, 57(7): 34-43.
[11]	杨培伟，周余红，邢岗，田智强，许夏瑜. 卷积神经网络在生物医学图像上的应用进展[J]. 计算机工程与应用, 2021, 57(7): 44-58.
[12]	常昊，陈晓雷，张爱华，李策，林冬梅. 嵌入改进SENet的卷积神经网络连续血压预测[J]. 计算机工程与应用, 2021, 57(7): 130-135.
[13]	李晖，张天垣，金纾羽. 古代中国格律诗中的社会情感挖掘[J]. 计算机工程与应用, 2021, 57(7): 171-177.
[14]	王翀，韩振奇，徐浩煜，祝永新，徐胜，陈夏. 基于改进显著图的高效裂纹检测算法[J]. 计算机工程与应用, 2021, 57(6): 219-224.
[15]	黄金杰，蔺江全，何勇军，何瑾洁，王雅君. 局部语义与上下文关系的中文短文本分类算法[J]. 计算机工程与应用, 2021, 57(6): 94-100.

基于弱监督预训练CNN模型的情感分析方法

Sentiment analysis method based on pre-training Convolutional Neural Networks by distant supervision

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics