计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (9): 152-157.DOI: 10.3778/j.issn.1002-8331.1511-0112
李志磊,蒋 芸,胡学伟,沈 健
LI Zhilei, JIANG Yun, HU Xuewei, SHEN Jian
摘要: 深入研究了基于[β]边界阈值选取的变精度粗糙集分类问题,提出[β]边界阈值选取新方法。由于以往变精度阈值[β]人为设定,面对复杂多变的多种类型的大数据集,其应用范围有限。因此提出平均包含度的概念,将平均包含度作为选取上下近似集的阈值,能够根据不同类型的数据集生成最优变精度阈值,将边界域中信息量较大的条件属性归入正域。实验结果表明,改进后的算法下近似集增加,上近似集减小,边界区域减小。在不增加额外训练时间的前提下,与传统可变精度粗糙集(Variable Precision Rough Set,VPRS)相比,分类精度明显提高。