计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (9): 134-137.DOI: 10.3778/j.issn.1002-8331.2010.09.038
汪红林1,2,王红玲1,2,周国栋1,2
WANG Hong-lin1,2,WANG Hong-ling1,2,ZHOU Guo-dong1,2
摘要: 谓词是句子中的最重要的成分,它的正确与否对语义分析的影响非常大。而众多的特征直接影响到谓词标识的性能,如何组织这些特征显得尤为重要。选取了7个基本特征和30多个新特征以及它们的组合,使用最大熵分类器,在基本特征的基础上通过增加有利特征的方法,使得谓词标注的F1值增长了约5%(由84.7%增加到89.8%),词义识别的F1值增长了约2%(由80.3%增加到82.1%),结果表明,这些新特征及其组合大大提高了性能。
中图分类号: