计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (17): 243-250.DOI: 10.3778/j.issn.1002-8331.1906-0062
陈雨婷,刘旭红,刘秀磊
CHEN Yuting, LIU Xuhong, LIU Xiulei
摘要:
招投标网站资源中蕴含着丰富的情报信息。“远程监督”方法借助知识库自动标注数据,弥补了传统信息抽取方法在语料准备阶段对人工强依赖的缺陷,可有效提高信息抽取效率。该方法会引入噪声数据,导致信息抽取效果不够理想。因此,提出一种基于因子图模型的远程监督实体关系抽取方法,并结合领域特征,采用知识融合技术提高实体抽取质量,进而针对远程监督的缺陷提出基于负例数据学习的降噪方法。实验结果表明,该方法能够有效减少“噪声”干扰,提高关系抽取性能。