计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (26): 122-124.DOI: 10.3778/j.issn.1002-8331.2010.26.038
朱颢东1,2,3,陈 宁4,李红婵1
ZHU Hao-dong1,2,3,CHEN Ning4,LI Hong-chan1
摘要: 在文本分类中,互信息是一种被广泛应用的特征选择方法,但是该方法仅考虑了特征的文档频而没有考虑特征的词频,导致它经常倾向于选择出现频率较低的特征。为此,提出了一个新的文档频并把它引入到互信息方法中,从而获得了一种优化的互信息方法。该优化的互信息方法不但考虑了特征的文档频而且还考虑了特征出现的词频。实验结果表明该优化的互信息方法性能良好。
中图分类号: