基于OC-SVM的大型数据集分类方法

doi:10.3778/j.issn.1002-8331.2011.04.036

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (4): 131-133.DOI: 10.3778/j.issn.1002-8331.2011.04.036

• 数据库、信号与信息处理 • 上一篇下一篇

基于OC-SVM的大型数据集分类方法

张瑜，罗可

长沙理工大学计算机与通信工程学院，长沙 410076

收稿日期:2009-05-18 修回日期:2009-07-15 出版日期:2011-02-01 发布日期:2011-02-01
通讯作者: 张瑜

OC-SVM-based classification for large-scale data sets

ZHANG Yu，LUO Ke

Institute of Computer and Communication Engineering，Changsha University of Science and Technology，Changsha 410076，China

Received:2009-05-18 Revised:2009-07-15 Online:2011-02-01 Published:2011-02-01
Contact: ZHANG Yu

摘要/Abstract

摘要： 支持向量机是最有效的分类技术之一，具有很高的分类精度和良好的泛化能力，但其应用于大型数据集时的训练过程还是非常复杂。对此提出了一种基于单类支持向量机的分类方法。采用随机选择算法来约简训练集，以达到提高训练速度的目的；同时，通过恢复超球体交集中样本在原始数据中的邻域来保证支持向量机的分类精度。实验证明，该方法能在较大程度上减小计算复杂度，从而提高大型数据集中的训练速度。

关键词: 单类支持向量机, 随机选择, 支持向量机分类, 大型数据集

Abstract: Support Vector Machine（SVM） is one of the most effective classifiers，which has very high classification accuracy and good generalization ability.However，SVM training yet is very complicated for large-scale data sets.A one-class SVM（OC-SVM）-based classification is proposed.In this method，training sets are reduced by the random selection algorithm to increase training speed.Meanwhile，original data which are the neighbors of samples in hypersphere intersection are recovered to ensure SVM classification accuracy.The experimental results show that the method reduces the computational complexity at a great extent，so the training speed is improved for large-scale data sets.

Key words: One-Class Support Vector Machine（OC-SVM）, random selection, Support Vector Machine（SVM） classification, large-scale data sets

中图分类号:

TP391

张瑜，罗可. 基于OC-SVM的大型数据集分类方法[J]. 计算机工程与应用, 2011, 47(4): 131-133.

ZHANG Yu，LUO Ke. OC-SVM-based classification for large-scale data sets[J]. Computer Engineering and Applications, 2011, 47(4): 131-133.

[1]	裔阳，周绍光，赵鹏飞，胡屹群. 基于正样本和未标记样本的遥感图像分类方法[J]. 计算机工程与应用, 2018, 54(4): 160-166.
[2]	陈琪1，蒋国平2，夏玲玲3. 基于静态结构的恶意代码同源性分析[J]. 计算机工程与应用, 2017, 53(14): 93-98.
[3]	李繁1，2，金明录1，刘继3. 分布式奇异值分解最小平方估计算法[J]. 计算机工程与应用, 2014, 50(3): 6-12.
[4]	段明秀. QPSO优化的改进CLARANS聚类算法[J]. 计算机工程与应用, 2013, 49(9): 168-170.
[5]	丁汝一，杨宁，董道国. 音视频相结合的广告检测算法[J]. 计算机工程与应用, 2012, 48(22): 184-188.
[6]	尹传环1，牟少敏2，田盛丰1，黄厚宽1. 单类支持向量机的研究进展[J]. 计算机工程与应用, 2012, 48(12): 1-5.
[7]	孙伟¹，周阳花²，奚茂龙¹. 非线性PID控制器参数优化方法[J]. 计算机工程与应用, 2010, 46(28): 244-248.
[8]	荣翠芳，李明楚，孙伟峰，姚红岩. 数据网格中一种均衡性能的副本一致性算法[J]. 计算机工程与应用, 2010, 46(22): 83-87.
[9]	刘莲花,谭台哲. 指纹图像质量自动评测方法研究[J]. 计算机工程与应用, 2009, 45(9): 164-167.

基于OC-SVM的大型数据集分类方法

OC-SVM-based classification for large-scale data sets

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 9

编辑推荐

Metrics