计算机工程与应用 ›› 2008, Vol. 44 ›› Issue (22): 39-42.DOI: 10.3778/j.issn.1002-8331.2008.22.011
王利民1,2,毛宇婷3,李雄飞1,2
WANG Li-min1,2,Mao Yu-ting3,LI Xiong-fei1,2
摘要: 由于条件属性在各样本的分布特性和所反映的主观特性的不同,每一个样本对应于真实情况的局部映射。建立了粗糙集理论中样本知识与信息之间的对应表示关系,给出了由属性约简求约简决策表的方法。基于后离散化策略处理连续属性,实现离散效率和信息损失之间的动态折衷。提出相对值条件互信息的概念衡量单一样本中各条件属性的相关性,可以充分利用现有数据处理不完备信息系统。即使在先验知识不足的情况下,也能通过主动学习构造新的规则补充进知识库中。拓广了粗糙集理论的应用范围,在UCI机器学习数据集上的实验结果和样例分析证明了该算法的合理性和有效性。