计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (9): 126-132.DOI: 10.3778/j.issn.1002-8331.1612-0103
高永兵1,张贵娟1,胡文江1,马占飞2
GAO Yongbing1, ZHANG Guijuan1, HU Wenjiang1, MA Zhanfei2
摘要: 地区官方微博中包含了大量相关当地的事件信息,聚合地区官方微博数据可以发掘当地的重要事件;结合地区微博数据地区别称、不同层级,地区标签属性突显等特征提出了基于后缀树算法的地区微博摘要技术研究。利用地区权值树和知网HowNet对地区微博数据进行预处理,将意思相近的词汇进行替换统一;利用后缀树聚类算法STC和奇异值分解SVD对地区微博进行聚类;结合地区微博特征对其综合打分,选取有代表性的微博句子生成摘要。实验验证了该方法的可行性,表明所提出的方法能够很好地识别出当地事件并生成可读性高的事件摘要。