计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (25): 121-124.DOI: 10.3778/j.issn.1002-8331.2009.25.037
袁伯秋,周一民,李 林
YUAN Bo-qiu,ZHOU Yi-min,LI Lin
摘要: 垃圾邮件处理是一项长期研究课题,越来越多的文本分类技术被移植到垃圾邮件处理应用当中。LDA(Latent Dirichlet Allocation)等topic模型在自动摘要、信息获取和其他离散数据应用中受到越来越多的关注。将LDA模型作为一种特征选择方法,引入垃圾邮件处理应用中。将LDA特征选择方法与质心+KNN分类器结合,得到简单的测试用垃圾邮件过滤器。初步实验结果表明,基于LDA的特征选择方法优于通常的IG、MI特征选择方法;测试过滤器的过滤性能与其他过滤器相当。
中图分类号: