计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (4): 8-11.DOI: 10.3778/j.issn.1002-8331.2010.04.003
朱颢东1,2,钟 勇1,2
ZHU Hao-dong1,2,ZHONG Yong1,2
摘要: 在文本分类中,特征空间维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象。为了提高文本挖掘算法的运行速度,降低占用的内存空间,提出了一种基于优化的模拟退火算法的特征选择方法。在该方法中,为避免遗失当前最优解,增加了记忆功能,将当前最好的状态记忆下来,从而使得模拟退火算法成为一种智能化算法;设计了一个自适应温度更新函数,并设置双阈值使得在尽量保持最优性的前提下减少计算量,从而较快地获得较具代表性的特征子集。实验结果表明该方法是有效的。
中图分类号: