计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (4): 175-183.DOI: 10.3778/j.issn.1002-8331.1811-0030
李东昊,杨文忠,仲丽君,张志豪,王雪颖
LI Donghao, YANG Wenzhong, ZHONG Lijun, ZHANG Zhihao, WANG Xueying
摘要:
突发事件容易引起社会舆论,是监管的重要对象。传统事件检测忽略了博文间影响力的差异。考虑到不同微博对事件的影响力不同,针对时序微博数据流,提出一种结合微博影响力与突发词的突发事件检测框架。在综合考虑用户及博文影响力的基础上,挖掘时间窗口内的重点微博,根据重点微博及历史数据计算突发词,再通过突发词检索的方式构建出具有突发性的潜在事件数据集,通过聚类算法检测突发事件。对比两种常见的事件检测方法,实验表明所提方法在准确率与效率上均有明显提升。