摘要: 提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Merging on Numerical Attribute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻区间,实现理想的离散方案。通过实验证明该算法在保持执行效率较高的前提下,离散结果更加合理,生成的决策树结构简单,获得较少的分类规则,分类准确率也有提高。
花海洋,赵怀慈. 一种新的无监督连续属性离散化方法[J]. 计算机工程与应用, 2011, 47(6): 208-211.
HUA Haiyang,ZHAO Huaici. New discretization method for numerical attributes based on clustering and merging[J]. Computer Engineering and Applications, 2011, 47(6): 208-211.