计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (26): 135-137.DOI: 10.3778/j.issn.1002-8331.2009.26.039
张 翔1,2,周明全1,3,耿国华1,侯 凡1
ZHANG Xiang1,2,ZHOU Ming-quan1,3,GENG Guo-hua1,HUO Fan1
摘要: 对于中文文本分类问题,提出一种新的Bagging方法。这一方法以决策树C4.5算法为弱分类器,通过实例重取样获取多个训练集,将其结果按照投票规则进行合成,最终得到分类结果。实验证明,这种算法的准确率、查全率、F1值比C4.5、kNN和朴素贝叶斯分类器都高,具有更加优良的性能。
中图分类号: