计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (7): 30-38.DOI: 10.3778/j.issn.1002-8331.1903-0501
王彩文,杨有龙
WANG Caiwen, YANG Youlong
摘要:
针对不平衡数据分类问题,一种基于密度的近邻分类算法(DNN)被提出。它利用核密度估计敏锐地捕捉不平衡数据的局部分布特征,由此产生更好的分类结果。用核密度估计方法估计查询实例的各类别密度,以此对其进行密度定位;将原始数据空间中的点映射到由类别密度和距离信息构成的空间;在这个映射空间中动态地选择近邻并对查询实例进行分类。实验结果表明,DNN算法在15个不平衡数据集上分类性能良好。