计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (12): 169-173.DOI: 10.3778/j.issn.1002-8331.1805-0482
安葳鹏,尚家泽
AN Weipeng, SHANG Jiaze
摘要: C4.5算法在选择分裂属性时只考虑了每个条件属性和决策属性之间的关系,而没有考虑到条件属性间的相关性,直接影响构建树的准确率。提出一种基于Kendall和谐系数的C4.5决策树优化算法,用于解决条件属性之间相关性的问题,提高算法属性选择的准确性。在引入系数的基础上运用等价无穷小原理对计算公式进行简化,提高了算法的效率。对改进后的C4.5算法和传统的算法进行仿真实验,结果表明,改进的C4.5算法在准确度和效率上都有较大提高。