计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (10): 157-162.DOI: 10.3778/j.issn.1002-8331.1901-0330
秦旭,杨文忠,王雪颖,马国祥,王庆鹏
QIN Xu, YANG Wenzhong, WANG Xueying, MA Guoxiang, WANG Qingpeng
摘要:
主题检测是互联网舆情分析任务中不可或缺的工作,在话题发现、热点话题等方面会遇到大量的不同种类的文本,它们有着不同的特性,却包含着相同的主题。有效地利用不同源的特性具有重要的科研和实践意义。大多数主题模型都是检测单一来源的文档,但媒体消息都是从多种平台进行传播,而且消息长度不一,不同平台都有其各自的属性,从而导致难以进行统一的舆情监控。为此,提出了一个基于共现关系的多源主题融合模型(Multi-source Topic Fusion Model,MTFM),该模型将共现(同一内容在不同地方出现)纳入到多源主题融合模型中实现异类源的准确话题提取。实验结果表明,与当前用于不同源主题检测的经典模型相比较,MTFM提供了另一种挖掘主题的方法。