计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (33): 129-133.

• 数据库、信号与信息处理 • 上一篇    下一篇

不平衡支持向量机的惩罚因子选择方法

金 鑫,李玉鑑   

  1. 北京工业大学 计算机学院,北京 100124
  • 收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-11-21 发布日期:2011-11-21

Error-cost selection for biased support vector machines

JIN Xin,LI Yujian   

  1. College of Computer Science,Beijing University of Technology,Beijing 100124,China
  • Received:1900-01-01 Revised:1900-01-01 Online:2011-11-21 Published:2011-11-21

摘要: 支持向量机在处理不平衡数据集时常常不能取得良好的效果,而基于不同惩罚因子的不平衡支持向量机能够较好地处理这个问题。阐述了支持向量机在不平衡数据集上失效的原因,讨论了不平衡支持向量机的求解算法,提出了一种根据数据集分布的平均密度直接选取惩罚因子的方法,以减少传统交叉验证方法选取参数所需的时间。实验表明,与其他方法相比,这种平均密度方法能够有效提高不平衡支持向量机在不平衡数据集上的识别效果。

关键词: 序列最小最优化, 不平衡支持向量机, 平均密度, 惩罚因子, 参数选取

Abstract: Standard SVM often performs poorly on imbalanced datasets,whereas biased-SVM can deal with the problem using two different error costs.This paper explains why SVM fails,discusses how to solve a biased-SVM,and proposes a direct method to determine the error costs,i.e.,“average density”,in order to reduce the time needed for their selection via traditional cross validation.Experimental results show that the average density method can efficiently and effectively improve the performance of biased-SVM on imbalanced datasets,better than the other methods for comparison.

Key words: sequential minimal optimization, biased-Support Vector Machines(SVM), average density, error cost, parameter selection