计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (13): 88-92.DOI: 10.3778/j.issn.1002-8331.1706-0274
尚玉玲1,曹建军2,李红梅1,刘 艺1
SHANG Yuling1, CAO Jianjun2, LI Hongmei1, LIU Yi1
摘要: 针对同一机构实体对应多个机构名称的问题,提出了一种基于Jaccard相似度数据空间转换的机构别名挖掘方法。根据机构与作者间的隶属关系,建立机构-作者二部图模型;采用Jaccard相似度度量两机构名称所对应作者姓名集合间的相似度;根据机构间的相似度矩阵,将集合型数据转换成数值型数据;通过计算机构名称对应的相似度向量间的余弦相似度,实现了机构别名的有效挖掘。最后用真实数据进行对比实验验证了该方法的优越性。