计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (16): 129-131.
冯 楠1,方德英2,解 晶1
FENG Nan1,FANG De-ying2,XIE Jing1
摘要: 提出了一种基于遗传算法的样本集数据分割方法。数据挖掘过程中该方法能够解决如何对一个样本集进行数据分割,从而得到最佳训练集和测试集的问题。通过该方法进行数据分割,不仅提高了分类模型的分类精度,而且能够最小化训练集和测试集之间的噪声百分比。最后,以一组软件项目样本数据为例说明该方法的有效性。