计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (25): 128-132.
李维杰,徐 勇
LI Wei-jie,XU Yong
摘要: 综合分析了垃圾邮件过滤的技术路线与方法,并在分析基于关键字的方法和统计学的方法的基础上,提出了将两者相结合,运用模式识别中的贝叶斯、最近邻和感知机等分类方法,实现对垃圾邮件的过滤的技术路线。以互信息最大化准则筛选出的特征集为基础,对不同分类技术的对比分析揭示了贝叶斯、最近邻和感知机在垃圾邮件过滤应用上的优劣。同时,文中对基于互信息最大化准则的垃圾邮件过滤应用提出了有益的思路。