计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (2): 127-130.DOI: 10.3778/j.issn.1002-8331.2011.02.040
鲁 婷,王 浩,姚宏亮
LU Ting,WANG Hao,YAO Hongliang
摘要: 在浩瀚的数据资源中,为了实现对特定主题的搜索或提取,文本自动分类技术已经成为目前研究的热点。KNN是一种重要的文本自动分类方法,KNN能够处理大规模数据,且具有较高的稳定性,但面临分类速度较慢的问题。以KNN方法为基础,引入特征项间的语义关系,并根据语义关系进行聚类生成中心文档,减少了KNN要搜索的文档数,提高了分类速度。仿真实验表明,该算法在不损失分类精度的情况下,显著提高了分类的速度。
中图分类号: