计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (30): 148-149.DOI: 10.3778/j.issn.1002-8331.2008.30.045
王 柯,朱启兵,崔宝同
WANG Ke,ZHU Qi-bing,CUI Bao-tong
摘要: 提出了一种基于区间数据分布特征的决策表连续属性离散化的方法。方法在断点的选择上考虑了属性值的出现频率,在区间内的一致性和区间之间的差异性基础上,利用条件信息量作为反馈信息合并区间。通过实验分析表明了算法的有效性,能保持决策表较高的分类能力,提高约简效率。