高斯序列核支持向量机用于说话人识别

doi:10.3778/j.issn.1002-8331.2010.18.057

计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (18): 183-185.DOI: 10.3778/j.issn.1002-8331.2010.18.057

• 图形、图像、模式识别 • 上一篇下一篇

高斯序列核支持向量机用于说话人识别

李杰，刘贺平

北京科技大学信息工程学院，北京 100083

收稿日期:2008-12-16 修回日期:2009-03-04 出版日期:2010-06-21 发布日期:2010-06-21
通讯作者: 李杰

Gaussian sequence kernel support vector machine for speaker recognition

LI Jie，LIU He-ping

College of Information Engineering，University of Science & Technology Beijing，Beijing 100083，China

Received:2008-12-16 Revised:2009-03-04 Online:2010-06-21 Published:2010-06-21
Contact: LI Jie

摘要/Abstract

摘要： 说话人识别问题具有重要的理论价值和深远的实用意义，在研究支持向量机核方法理论的基础上，将其与传统高斯混合模型（GMM）相结合构建成基于高斯序列核的支持向量机（SVM）。SVM的灵活性和强大分类能力主要在于可以根据要处理的问题来相应的选取核函数。在识别的过程中引入特征空间归正技术NAP（Nuisance Attribute Projection）对同一说话人在不同信道和环境所带来的特征差异进行弥补。用美国国家标准与技术研究所（NIST）2004年评测数据集进行实验，结果表明该方法可以大幅度提高识别率。

关键词: 支持向量机, 高斯线性核, 高斯非线性核, NAP技术, 说话人识别

Abstract: Speaker recognition problems have important theoretical value and far-reaching practical significance.On the basis of the support vector machine kernel methods，this paper combines it with traditional Gaussian Mixture Model（GMM） to build into a new support vector machine based on Gaussian sequence kernel.Much of the flexibility and classification power of SVM resides in the choice of kernel.And in the process of identifying，it introduces feature space norm technology performed by Nuisance Attribute Projection（NAP） to compensate the feature difference in different channels and environment from the same speaker.It is tested on the National Institute of Standards and Technology（NIST） 2004 evaluation database.Experiments results show that this method can greatly improve the recognition rate.

Key words: support vector machine, Gaussian linear kernel, Gaussian non-linear kernel, Nuisance Attribute Projection（NAP）, speaker recognition

中图分类号:

TP912

李杰，刘贺平. 高斯序列核支持向量机用于说话人识别[J]. 计算机工程与应用, 2010, 46(18): 183-185.

LI Jie，LIU He-ping. Gaussian sequence kernel support vector machine for speaker recognition[J]. Computer Engineering and Applications, 2010, 46(18): 183-185.

[1]	高一锴，彭力，徐龙壮. 改进AFSA算法优化TWSVM的火焰识别方法[J]. 计算机工程与应用, 2021, 57(8): 204-213.
[2]	韩卫宇，程龙生. 结合马田系统-SVM的滚动轴承故障模式分类研究[J]. 计算机工程与应用, 2021, 57(6): 239-246.
[3]	雷恒林，古兰拜尔·吐尔洪，买日旦·吾守尔，张东梅. 新奇检测综述[J]. 计算机工程与应用, 2021, 57(5): 47-55.
[4]	温杰彬，杨文忠，马国祥，张志豪，李海磊. 基于Apex帧光流和卷积自编码器的微表情识别[J]. 计算机工程与应用, 2021, 57(4): 127-133.
[5]	李俊侠，张秦，郑桂妹. 超宽带雷达人体姿态识别综述[J]. 计算机工程与应用, 2021, 57(3): 14-23.
[6]	徐先峰，蔡路路，张丽. 融合MLP和DBN的光伏发电预测算法[J]. 计算机工程与应用, 2021, 57(3): 266-272.
[7]	陈富健，谢维信，夏婷. 基于LCT+的自适应抗遮挡目标跟踪算法[J]. 计算机工程与应用, 2021, 57(22): 190-198.
[8]	杨泉. N1+N2结构语法关系判定的SVM算法[J]. 计算机工程与应用, 2021, 57(20): 104-108.
[9]	高晋，赵云芃，Godfred Kim Mensah，李欣芸，刘志芬，陈俊杰，郭浩. 静息态功能脑连接的空间动态分析及分类研究[J]. 计算机工程与应用, 2021, 57(2): 150-155.
[10]	秦博宇，郝晓燕，刘永芳. 基于SVM和CRF双层模型的FrameNet框架消歧[J]. 计算机工程与应用, 2021, 57(18): 255-262.
[11]	郑淋文，周金治，黄静. 深度稀疏自编码器在ECG特征提取中的应用[J]. 计算机工程与应用, 2021, 57(11): 156-161.
[12]	温廷新，孔祥博. 不平衡样本下的金融市场极端风险预警研究[J]. 计算机工程与应用, 2020, 56(8): 256-260.
[13]	曾春艳，马超峰，王志锋，朱栋梁，赵楠，王娟，刘聪. 深度学习框架下说话人识别研究综述[J]. 计算机工程与应用, 2020, 56(7): 8-16.
[14]	陈菲雨，岳文斌，饶颖露，邢金昊，马晓静. 基于改进TLD算法的无人机自主精准降落[J]. 计算机工程与应用, 2020, 56(7): 247-254.
[15]	马玲，罗晓曙，蒋品群. 基于模板匹配和支持向量机的点阵字符识别研究[J]. 计算机工程与应用, 2020, 56(4): 134-139.

高斯序列核支持向量机用于说话人识别

Gaussian sequence kernel support vector machine for speaker recognition

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics