计算机工程与应用 ›› 2017, Vol. 53 ›› Issue (3): 169-173.DOI: 10.3778/j.issn.1002-8331.1507-0245
胡小生,钟 勇
HU Xiaosheng, ZHONG Yong
摘要: 针对支持向量机(Support Vector Machine,SVM)处理大规模数据集的学习时间长、泛化能力下降等问题,提出基于边界样本选择的支持向量机加速算法。首先,进行无监督的K均值聚类;然后,在各个聚簇内依照簇的混合度、支持度因素应用K近邻算法剔除非边界样本,获得最终的类别边界区域样本,参与SVM模型训练。在标准数据集上的实验结果表明,算法在保持传统支持向量机的分类泛化能力的同时,显著降低了模型训练时间。