计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (14): 156-160.DOI: 10.3778/j.issn.1002-8331.1905-0071
孟东霞,李玉鑑
MENG Dongxia, LI Yujian
摘要:
针对实际应用中存在的数据集分布不平衡的问题,提出一种融合特征边界数据信息的过采样方法。去除数据集中的噪声点,基于少数类样本点的多类近邻集合,融合特征边界的几何分布信息获得有利于定义最优非线性分类边界的少数类样本点,通过其与所属类簇的结合生成新样本。对不平衡数据集采用多种过采样技术处理后,利用支持向量机进行分类,对比实验表明所提方法有效改善了不平衡数据的分类精度,验证了算法的有效性。