计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (22): 121-125.DOI: 10.3778/j.issn.1002-8331.1605-0342
于海燕,陆慧娟,郑文斌
YU Haiyan, LU Huijuan, ZHENG Wenbin
摘要: 在文本情感分类中,传统的特征表达通常忽略了语言知识的重要性。提出了一种基于词性嵌入的特征权重计算方法,通过构造一种特征嵌入模式将名词、动词、形容词、副词四种词性对情感分类的贡献度嵌入到传统的TF-IDF(Term Frequency-Inverse Document Frequency)权值中。其中,词性的情感贡献度通过粒子群优化算法获得。实验采用支持向量机完成分类,并对比了不同知识的嵌入情况,包括词性、情感词及词性和情感词的组合。结果表明基于词性嵌入的方法分类性能最优,可以显著提高中文文本情感分类的准确率。