计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (1): 172-178.DOI: 10.3778/j.issn.1002-8331.1607-0159
郭小华1,彭 琦2,邓 涵1,朱新华1
GUO Xiaohua1, PENG Qi2, DENG Han1, ZHU Xinhua1
摘要: 针对目前词语相似度算法中普遍存在的信息源单一化,计算结果非线性偏高,以及计算性能和效率的不一致的缺陷,提出了一种基于边权重的WordNet词语相似度的计算方法。该方法在路径与深度的基础上,通过边权重改善WordNet结构中的层次不均匀性,引入编码概念唯一标识两个概念间的相似度,并利用余弦函数修正计算结果的非线性偏差。实验结果表明,对于MC30和RG65测试集,使用该方法计算的词语相似度值与人工判定值计算得到的Pearson相关系数均达到0.87;此外,该方法在计算性能和效率上均保持较高水平。