计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (16): 150-156.DOI: 10.3778/j.issn.1002-8331.1804-0218
张扬帆,张海鹏,孙俊
ZHANG Yangfan, ZHANG Haipeng, SUN Jun
摘要: 针对不平衡数据集上的分类问题,提出了基于Lévy分布的过采样方法,其核心思想是根据初始数据集的分布,利用Lévy分布构造新样本的密度分布。基于Lévy分布的特性,使得从边界样本合成的新样本密度最大,靠近多数类的样本合成的新样本密度次之,靠近少数类的样本合成的新样本密度最小。因此,该算法可以增强分类边界,同时可以减小噪声生成。通过在多个数据集上的实验,表明所提算法可以有效改善不平衡数据的分类效果。