计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (2): 129-131.DOI: 10.3778/j.issn.1002-8331.2010.02.039
张永奎1,2,高 峰1
ZHANG Yong-kui1,2,GAO Feng1
摘要: 针对不良文本的特殊性,提出一种两步特征选择方法。首先对训练文本用有限自动机识别其中的特殊词作为特征加入特征集,同时将原文还原为不含特殊词的文本。对还原后文本用“组合特征选择方法”选择特征加入特征集。实验结果表明利用两步特征选择方法能有效提高非法文本识别精度。
中图分类号: