计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (32): 126-129.DOI: 10.3778/j.issn.1002-8331.2009.32.040
贾美英1,3,杨炳儒1,郑德权2,3,杨 靖2
JIA Mei-ying1,3,YANG Bing-ru1,ZHENG De-quan2,3,YANG Jing2
摘要: 针对军事情报领域,提出了一种基于条件随机场的术语抽取方法,该方法将领域术语抽取看作一个序列标注问题,将领域术语分布的特征量化作为训练的特征,利用CRF工具包训练出一个领域术语特征模板,然后利用该模板进行领域术语抽取。实验采用的训练语料来自“搜狐网络军事频道”的新闻数据,测试语料选取《现代军事》杂志2007年第1~8期的所有文章。实验取得了良好的结果,准确率为73.24%,召回率为69.57%,F-测度为71.36%,表明该方法简单易行,且具有领域通用性。
中图分类号: