计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (33): 18-21.
高 静1,韩智东2
GAO Jing1,HAN Zhidong2
摘要: 分析了基于正区域、基于粗糙边界和基于依赖度的属性选择标准的关系,证明了这三种属性选择标准彼此等价。以正区域的属性选择标准为代表,分析了基于正区域的决策树生成算法的优点和不足。针对这些不足,提出基于差别元素的大小为新的属性选择标准。用新的属性选择标准生成的决策树一般具有叶子数目较少,叶子的平均深度也较小,且叶子具有较强的泛化能力。用一实例说明了新的属性选择标准的优越性。