计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (10): 147-149.
施水才1,2,王 锴1,韩艳铧1,2,吕学强1,2
SHI Shuicai1,2, WANG Kai1, HAN Yanhua1,2, LV Xueqiang1,2
摘要: 领域术语是各个领域的核心词汇,在研究了大量领域文献的基础上,提出了一种识别领域术语的方法。该方法以现有成熟工具为依托,使用条件随机场模型统计领域术语的词性组合概率。在选定特征集后,通过调整特征和窗口的组合,制定一个最优特征模板,同时通过10倍交叉验证法确定模型训练参数。实验结果表明,通过条件随机场模型分析领域术语的词性组合概率能够有效地识别领域术语。