计算机工程与应用 ›› 2022, Vol. 58 ›› Issue (6): 142-148.DOI: 10.3778/j.issn.1002-8331.2009-0480
汪玉,王鑫,张淑娟,郑国强,赵龙,郑高峰
WANG Yu, WANG Xin, ZHANG Shujuan, ZHENG Guoqiang, ZHAO Long, ZHENG Gaofeng
摘要: 知识融合是知识图谱技术的关键环节,而传统机器学习算法较难满足异构大数据环境中知识融合的准确性及实时性需求。提出一种结合概念漂移检测算法与无监督反向验证算法的高可靠、低复杂度知识融合方法。该方法利用贝叶斯估计进行实体对齐与属性融合的同时,周期性进行基于孤立深林算法的概念漂移检测与基于自组织映射网络的反向实体消歧,以此有效互补监督学习的样本依赖性及无监督学习的高复杂度特性,从而提高知识融合的可靠性与实时性。提出算法在公开数据集与国网安徽省电力公司知识图谱数据库中分别进行了数据实验,通过对数据模型可靠性、实体对齐能力、F1分数和运行时间的比较,分析了提出算法在多维、异构大数据环境的应用可行性。