计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (18): 15-20.DOI: 10.3778/j.issn.1002-8331.1905-0187
张敏华,杜友田,王倩
ZHANG Minhua, DU Youtian, WANG Qian
摘要: 网络世界是人们获取信息的重要来源,各大新闻门户网站成为信息产生和传播的主要聚集地。网络信息具有不规范、噪声大、动态性等特点。为了有效地组织网络信息,提出一种结合静态和动态建模的方法来对网络新闻事件进行聚合。静态建模基于新闻发帖内容的相似程度进行事件的初步聚合;动态建模是指基于隐马尔可夫模型来刻画事件的动态发展过程,并判断当前新闻发帖是否符合事件的发展规律。该方法将事件聚合从仅考虑内容空间中的相似度推广至包含内容及事件动态规律两个方面的空间来进行相似度度量,对内容相似的不同事件能够进行更好地区分。通过实际数据上的实验测试结果表明,该方法能够有效提升事件聚合的准确性。