计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (17): 44-50.DOI: 10.3778/j.issn.1002-8331.1805-0332
何丽,刘颖,韩克平
HE Li, LIU Ying, HAN Keping
摘要: 深度学习的迅速发展需要大量有标记数据的支持,而实际数据中往往带有未知比例的噪声标记,会直接影响分类器的最终结果。针对数据集中错误标记的存在,提出了一种噪声标注下的TSVM改进算法,该方法利用聚类筛选出错分率较高的簇,通过交换错分率较高的两个簇的标签,减少TSVM算法中噪声标记的传递和累加,能够有效地提高标记准确率,增强TSVM分类器对不同比例噪声的鲁棒性。为了验证提出算法的有效性,通过在选取的UCI数据集上加入不同比例的噪声标签对算法进行了实验。实验结果表明,该算法在含有不同噪声标记比例的数据集上的鲁棒性均优于SVM和TSVM算法。