计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (18): 165-170.DOI: 10.3778/j.issn.1002-8331.2001-0148
陈欢,黄勃,朱翌民,俞雷,余宇新
CHEN Huan, HUANG Bo, ZHU Yimin, YU Lei, YU Yuxin
摘要:
在对短文本进行情感分类任务的过程中,由于文本长度过短导致数据稀疏,降低了分类任务的准确率。针对这个问题,提出了一种基于潜在狄利克雷分布(LDA)与Self-Attention的短文本情感分类方法。使用LDA获得每个评论的主题词分布作为该条评论信息的扩展,将扩展信息和原评论文本一起输入到word2vec模型,进行词向量训练,使得该评论文本在高维向量空间实现同一主题的聚类,使用Self-Attention进行动态权重分配并进行分类。通过在谭松波酒店评论数据集上的实验表明,该算法与当前主流的短文本分类情感算法相比,有效地提高了分类性能。