摘要: 特征降维是文本分类过程中的一个重要环节。在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法。实验采用K-最近邻分类算法(KNN)来考查CR方法的有效性,实验结果表明该方法能够取得比现有特征选择方法更优的降维效果。
张玉芳,王 勇,刘 明,熊忠阳. 新的文本分类特征选择方法研究[J]. 计算机工程与应用, 2013, 49(5): 132-135.
ZHANG Yufang, WANG Yong, LIU Ming, XIONG Zhongyang. New feature selection approach for text categorization[J]. Computer Engineering and Applications, 2013, 49(5): 132-135.