计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (25): 146-148.DOI: 10.3778/j.issn.1002-8331.2008.25.044
严志嘉1,2,金连甫1
YAN Zhi-jia1,2,JIN Lian-fu1
摘要: 节点属性的选择是决策树生成过程中的关键环节,以ID3和C4.5为代表的经典决策树算法中,树节点的选择是通过子集样本数计算信息增益或增益比例得到的。但是,对于连续性属性,由于离散化分割导致了子集边界元素在隶属关系上的模糊,使样本计算的方式存在了一定的不合理性,为解决这一问题,采用了模糊集理论并以模糊度的方式取代样本个数参与增益比例的计算,给出了一种获得决策树分类中不确定性尺度的可行途径。