计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (33): 144-147.DOI: 10.3778/j.issn.1002-8331.2008.33.045
袁晓洁,师建兴,宁 华,于士涛
YUAN Xiao-jie,SHI Jian-xing,NING Hua,YU Shi-tao
摘要: 问题分类是问答系统中一个非常重要的子模块,其关键在于问题的特征选择。考虑了问题的句法信息和语义信息,提出了一种利用问题疑问词、依存关系、主要动词、中心名词和名词的最高上位词作为特征进行分类的新方法。实验中,采用k-最邻近和朴素贝叶斯两种分类算法对该方法进行测试,结果表明了该方法具有较好的分类效果。在自定义的分类体系上,分别达到了82.2%和83.7%的分类精度,性能高于基于bag-of-words的特征选择方法。