计算机工程与应用 ›› 2022, Vol. 58 ›› Issue (3): 222-229.DOI: 10.3778/j.issn.1002-8331.2009-0090
陈丹华,王艳娜,周子力,赵晓函,李天宇,王凯莉
CHEN Danhua, WANG Yanna, ZHOU Zili, ZHAO Xiaohan, LI Tianyu, WANG Kaili
摘要: 当前大部分WordNet词语相似度计算方法由于未充分考虑词语的语义信息和位置关系,导致相似度的准确率降低。为解决上述问题,提出了一种使用词向量模型Word2Vec计算WordNet词语相似度的新方法。在构建WordNet数据集时提出一种新形式,不再使用传统的文本语料库,同时提出信息位置排列方法对数据集加以处理。利用Word2Vec模型训练WordNet数据集后得到向量表示。在公开的R&G-65、M&C-30和MED38词语相似度测评集上完成了词语相似度计算任务,从多个角度进行了Pearson相关系数对比实验。结果显示该文计算的相似度值与人工判定值计算取得的Pearson相关系数指标得到了显著提升。