计算机工程与应用 ›› 2014, Vol. 50 ›› Issue (6): 127-131.
董丽丽1,李 欢1,张 翔1,刘闫锋2
DONG Lili1, LI Huan1, ZHANG Xiang1, LIU Yanfeng2
摘要: 针对统计学方法在领域概念获取时缺少词语语义信息的问题,提出了一种结合语义相似度和改进近邻传播算法的领域概念自动获取方法。该方法通过互信息进行合成词提取,使用对数似然比避免对低频词的遗漏,利用HowNet和余弦相似度识别术语间同义词,采用改进的近邻传播算法获取领域概念集合。实验结果表明,该方法在准确率、召回率和困惑度变化率上比传统的方法都有较大提高。