计算机工程与应用 ›› 2015, Vol. 51 ›› Issue (13): 145-148.
樊小超1,2,张重阳1,邓雄伟1
FAN Xiaochao1,2, ZHANG Chongyang1, DENG Xiongwei1
摘要: 特征加权是文本分类中的重要环节,通过考察传统的特征选择函数,发现互信息方法在特征加权过程中表现尤为突出。为了提高互信息方法在特征加权时的性能,加入了词频信息、文档频率信息以及类别相关度因子,提出了一种基于改进的互信息特征加权方法。实验结果表明,该方法比传统的特征加权方法具有更好的分类性能。