计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (3): 148-151.DOI: 10.3778/j.issn.1002-8331.2009.03.044
周万里,邱洪泽,尹作海
ZHOU Wan-li,QIU Hong-ze,YIN Zuo-hai
摘要: 决策树是数据挖掘中的一种高效方法,但是当训练数据的属性很多时,构建的决策树的规模会随属性个数增加而指数级增长,进而会产生海量的规则。针对该问题,提出了一种基于遗传算法的优化方法。首先根据信息增益利用轮盘赌方法选取若干组属性,构建多棵决策树,然后利用遗传算法对多棵决策树进行组合,并最终形成规则集。最后给出了实验结果,证明了该方法的可行性和有效性。