计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (6): 61-66.
孙曰昕,马慧芳,姚 伟,张志昌
SUN Yuexin, MA Huifang, YAO Wei, ZHANG Zhichang
摘要: 为了解决短文本信息流的特征稀疏性对热点话题发现带来的挑战,提出了结合词语互信息和概率主题模型的微博热点话题发现方法。通过建立词共现矩阵并应用对称非负矩阵分解算法获取词项-主题矩阵,再利用概率潜在语义分析模型进行主题发现,最终通过定义微博热度分析和排序,有效地支持微博热点话题发现。实验表明,此方法能有效地进行话题聚类并检测出热点话题。