计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (20): 100-104.DOI: 10.3778/j.issn.1002-8331.1604-0231
陈秋瑗1,2,程 光1,2,李 迪1,2,张 建1,2
CHEN Qiuyuan1,2, CHENG Guang1,2, LI Di1,2, ZHANG Jian1,2
摘要: 命名实体识别技术在自然语言处理技术中占有重要的地位,通用的方法不能很好地解决机械领域的识别问题。基于字符串之间紧密相邻程度等统计特征,定义不同词之间紧密相连的程度,从而识别机械领域的领域词。通过计算特征值,用逻辑回归的方法确定相邻字串的紧密相邻程度,从而发现新词。该方法对比通用的方法准确率和召回率得到了提高,更好地识别机械领域的领域词。