计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (35): 156-158.
周炎涛1,2,唐剑波1,王家琴1
ZHOU Yan-tao1,2,TANG Jian-bo1,WANG Jia-qin1
摘要: 特征的选择对文本分类的精确性有着非常重要的影响。针对传统的TFIDF没有考虑特征词条在各个类之间的分布的不足,对TFIDF特征选择算法进行了深入的分析,并结合信息熵的概念提出了一种新的TFIDF特征选择算法。实验结果表明,改进后的算法可以有效地提高文本分类的精确度。