计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (3): 131-133.DOI: 10.3778/j.issn.1002-8331.2010.03.039
王 鹏,樊兴华
WANG Peng,FAN Xing-hua
摘要: 为了利用依存关系进行短文本分类,研究了利用依存关系进行短文本分类存在的四个关键问题。分别在长文本语料集和两个短文本语料集上,抽取具有依存关系的词对,并利用这些词对作为特征进行分类实验。实验结果表明:依存关系能够作为有效的特征进行文本分类,并能够改善文本分类的性能;单独把依存关系作为特征,不能提高短文本的分类性能;可以利用依存关系作为特征扩充的手段,增加短文本的特征,增强短文本的描述能力,进而进行有效的短文本分类。
中图分类号: