计算机工程与应用 ›› 2014, Vol. 50 ›› Issue (15): 75-81.
宋 鑫,张 瑜,胡 轶
SONG Xin, ZHANG Yu, HU Yi
摘要: 针对Web页中存在不少不真实信息的问题,提出了一个两步的方法来鉴别一个中文陈述句是否是事实。第一步根据陈述句中的不确定单元对陈述句进行分类扩展,找到一些和待验证陈述句主题匹配的候选陈述句。第二步把候选陈述句代入现有搜索引擎,确定出最有可能的候选。这两步过程都需要从主流的搜索引擎的搜索结果中抽取各种特性。实验结果表明,准确率可以达到85%以上。经过改进,该技术可以用来评测网页的可信度。