计算机工程与应用 ›› 2018, Vol. 54 ›› Issue (14): 95-99.DOI: 10.3778/j.issn.1002-8331.1705-0170
仇国庆,张少昀,赵婉滢,马 俊
QIU Guoqing, ZHANG Shaoyun, ZHAO Wanying, MA Jun
摘要: 文本分类在采用向量空间模型(VSM)表达文本特征时,容易出现特征向量高维且稀疏的现象,为了对原始的文本特征向量进行有效简化,提出了一种基于粒子群(PSO)优化独立分量分析(ICA)进行降维的方法,并将其运用到文本分类中。在该算法中,以负熵作为粒子群算法的适应度函数,依据其高斯性原理作为独立性判别标准对分离矩阵进行自适应更新。实验结果表明,相比于传统的特征降维方法,该方法可以解决高维度文本特征向量降维困难的问题,使得文本分类的效率、准确率显著提升。