一种改进的KNN文本分类

计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (2): 142-144.

• 数据库、信号与信息处理 • 上一篇下一篇

一种改进的KNN文本分类

钟将，刘荣辉

重庆大学计算机学院，重庆 400044

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2012-01-11 发布日期:2012-01-11

Improved KNN text categorization

ZHONG Jiang, LIU Ronghui

College of Computer Science, Chongqing University, Chongqing 400044, China

Received:1900-01-01 Revised:1900-01-01 Online:2012-01-11 Published:2012-01-11

摘要/Abstract

摘要： 在文本分类中，文本特征空间维数巨大以及训练样本分布不均衡等问题影响分类性能。针对这个问题，提出一种改进的KNN分类方法。利用隐含语义分析方法对特征样本空间进行降维处理；利用基于样本密度的改进的KNN分类器进行分类。实验结果表明提出的方法能够收到较好的分类效果。

关键词: 特征降维, 潜在语义分析, K-最近邻法, 文本分类

Abstract: In text categorization, the problems of large feature dimension and samples data distributed imbalanced influence the classified results. To this problem, this paper puts forward an improved KNN method. Using latent semantic analysis to reduce dimensionality of text feature matrix. Using improved KNN method based on density to realize text categorization. The experimental results show that the proposed method can effectively improve the text categorization precision.

Key words: feature reduction, latent semantic analysis, K-Nearest Neighbor（KNN）, text categorization

钟将，刘荣辉. 一种改进的KNN文本分类[J]. 计算机工程与应用, 2012, 48(2): 142-144.

ZHONG Jiang, LIU Ronghui. Improved KNN text categorization[J]. Computer Engineering and Applications, 2012, 48(2): 142-144.

[1]	霍光煜，张勇，孙艳丰，尹宝才. 基于语义的档案数据智能分类方法研究[J]. 计算机工程与应用, 2021, 57(6): 247-253.
[2]	黄金杰，蔺江全，何勇军，何瑾洁，王雅君. 局部语义与上下文关系的中文短文本分类算法[J]. 计算机工程与应用, 2021, 57(6): 94-100.
[3]	郑诚，董春阳，黄夏炎. 基于BTM图卷积网络的短文本分类方法[J]. 计算机工程与应用, 2021, 57(4): 155-160.
[4]	贺文亮，朱敏玲. 胶囊神经网络研究现状与未来的浅析[J]. 计算机工程与应用, 2021, 57(3): 33-43.
[5]	滕金保，孔韦韦，田乔鑫，王照乾，李龙. 基于CNN和LSTM的多通道注意力机制文本分类模型[J]. 计算机工程与应用, 2021, 57(23): 154-162.
[6]	武书钊，李功权，卜明伟. 基于知识图谱的自杀倾向检测问答系统构建[J]. 计算机工程与应用, 2021, 57(22): 304-312.
[7]	李铁飞，生龙，吴迪. BERT-TECNN模型的文本分类方法研究[J]. 计算机工程与应用, 2021, 57(18): 186-193.
[8]	丁勇，程家桥，蒋翠清，王钊. 基于主题和关键词特征的比较文本分类方法[J]. 计算机工程与应用, 2021, 57(17): 196-202.
[9]	滕金保，孔韦韦，田乔鑫，王照乾. 基于LSTM-Attention与CNN混合模型的文本分类方法[J]. 计算机工程与应用, 2021, 57(14): 126-133.
[10]	翟一鸣，王斌君，周枝凝，仝鑫. 面向文本分类的多头注意力池化RCNN模型[J]. 计算机工程与应用, 2021, 57(12): 155-160.
[11]	姚佳奇，徐正国，燕继坤，王科人. GCN-PU:基于图卷积网络的PU文本分类算法[J]. 计算机工程与应用, 2021, 57(11): 162-167.
[12]	申艳光，贾耀清. 基于词共现与图卷积的文本分类方法[J]. 计算机工程与应用, 2021, 57(11): 173-178.
[13]	郝超，裘杭萍，孙毅，张超然. 多标签文本分类研究进展[J]. 计算机工程与应用, 2021, 57(10): 48-56.
[14]	张曼，夏战国，刘兵，周勇. 全卷积神经网络的字符级文本分类方法[J]. 计算机工程与应用, 2020, 56(5): 166-172.
[15]	唐庄，王志舒，周爱，冯美姗，屈雯，鲁明羽. 面向文本分类的transformer-capsule集成模型[J]. 计算机工程与应用, 2020, 56(24): 151-156.

一种改进的KNN文本分类

Improved KNN text categorization

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics