摘要: 提出了一种基于K近邻(KNN)原理的快速文本分类算法。该算法不仅具有原始K近邻算法分类效果好的优点,还通过对训练样本进行压缩,消除相似度之间的比较,提高了分类效率。实验表明,该算法用于邮件过滤系统时,分类效果要优于基于朴素贝叶斯分类器的二项独立模型和多项式模型,而分类的时间复杂度与其相当,完全可以应用于实时邮件过滤。
田 泽,颜松远,徐敬东. 基于改进K近邻的垃圾邮件过滤技术[J]. 计算机工程与应用, 2007, 43(25): 178-181.
TIAN Ze,YAN Song-yuan,XU Jing-dong. Spam filtering method based on improved KNN[J]. Computer Engineering and Applications, 2007, 43(25): 178-181.