计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (33): 184-187.
骆世广1,骆昌日2
1.广东金融学院 应用数学系,广州 510521
2.华中师范大学 网络学院,武汉 430079
LUO Shi-guang1,LUO Chang-ri2
摘要: SMO(序贯最小优化算法)算法是目前解决支持向量机训练问题的一种十分有效的方法,但是当面对大样本数据时,SMO训练速度比较慢。考虑到在SVM的优化过程中并不是所有样本都能影响优化进展,提出了两种删除样本的策略:一种是基于距离,一种是基于拉格朗日乘子的值。在几个著名的数据集的试验结果表明,两种策略都可以大大缩短SMO的训练时间,特别适用于大样本数据。