计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (9): 134-137.
穆海军1,鄂 旭1,2,3,金成美1,王全铁3
MU Haijun1, E Xu1,2,3, JIN Chengmei1, WANG Quantie3
摘要: 随着数据挖掘和知识发现等技术的迅速发展,出现了很多数据离散的算法,但是,已有的离散化方法大多是针对固定点上的连续属性值的情况,实际应用中大量存在着连续区间属性值的情况。针对这一问题,提出了一种连续区间属性值离散化的新方法。通过区间数的相似度来描述对象间的相似关系,定义相似度阈度确定离散关系,来实现对区间数据的离散化,经过分析相似度在算法中的作用,提出了一种新的变量——关联度,改进了算法。采用多组数据对此算法的性能进行了检验,与其他算法做了对比试验,试验结果表明此算法是有效的。