一种概率序列核在说话人识别中的应用

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (6): 151-155.

• 数据库、信号与信息处理 • 上一篇下一篇

一种概率序列核在说话人识别中的应用

雷震春

江西师范大学计算机学院，南昌 330022

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-02-21 发布日期:2011-02-21

Probabilistic sequence kernel for speaker recognition

LEI Zhenchun

Department of Computer and Information Engineering，Jiangxi Normal University，Nanchang 330022，China

Received:1900-01-01 Revised:1900-01-01 Online:2011-02-21 Published:2011-02-21

摘要/Abstract

摘要： 以说话人识别中的背景模型为基础，根据模型中的各个高斯分量，构造出说话人特征空间，将长度不一样的语句映射成为空间中大小相同的向量，且经过相关矩阵进行规整后，采用线性支持向量机进行说话人识别。借鉴几种常见的特征规整方式，结合语句映射后的向量，提出四种不同的规整方法：均值/方差规整、权重规整、WLOG规整和球形规整，并与概率序列核进行比较研究。根据语音特征向量序列中相邻的特征向量的前后转移关系，结合提出的概率序列核，构造出转移概率序列核。实验在NIST2001库上进行，结果表明概率序列核模型识别性能接近经典的UBM-MAP模型，将这两类模型得分进行融合，可非常明显地提高识别性能，进一步融合转移概率序列核后，性能还可提高19.1%。

关键词: 说话人识别, 概率序列核, 通用背景模型, 支持向量机

Abstract: This paper proposes a probabilistic sequence kernel based on the universal background model.The Gaussian components are used to construct the speaker character space，and the utterances with different length are mapped into the fixed size vectors after normalization with correlation matrix.Then four feature normalization methods is proposed for the mapped vectors：mean/variance normalization，weight scaling，WLOG scaling and spherical normalization.Finally the normalized vectors are inputted to the linear support vector machine for speaker recognition.A transfer probabilistic sequence kernel is also proposed，which adapts the transfer information between neighbor frames.The experiments on NIST 2001 show that the probabilistic sequence kernel is compared with the traditionally UBM-MAP model and the performance will be improved clearly after the linear fusion of the models.

Key words: speaker recognition, probabilistic sequence kernel, universal background model, support vector machine

雷震春. 一种概率序列核在说话人识别中的应用[J]. 计算机工程与应用, 2011, 47(6): 151-155.

LEI Zhenchun. Probabilistic sequence kernel for speaker recognition[J]. Computer Engineering and Applications, 2011, 47(6): 151-155.

[1]	高一锴，彭力，徐龙壮. 改进AFSA算法优化TWSVM的火焰识别方法[J]. 计算机工程与应用, 2021, 57(8): 204-213.
[2]	韩卫宇，程龙生. 结合马田系统-SVM的滚动轴承故障模式分类研究[J]. 计算机工程与应用, 2021, 57(6): 239-246.
[3]	雷恒林，古兰拜尔·吐尔洪，买日旦·吾守尔，张东梅. 新奇检测综述[J]. 计算机工程与应用, 2021, 57(5): 47-55.
[4]	温杰彬，杨文忠，马国祥，张志豪，李海磊. 基于Apex帧光流和卷积自编码器的微表情识别[J]. 计算机工程与应用, 2021, 57(4): 127-133.
[5]	李俊侠，张秦，郑桂妹. 超宽带雷达人体姿态识别综述[J]. 计算机工程与应用, 2021, 57(3): 14-23.
[6]	徐先峰，蔡路路，张丽. 融合MLP和DBN的光伏发电预测算法[J]. 计算机工程与应用, 2021, 57(3): 266-272.
[7]	陈富健，谢维信，夏婷. 基于LCT+的自适应抗遮挡目标跟踪算法[J]. 计算机工程与应用, 2021, 57(22): 190-198.
[8]	杨泉. N1+N2结构语法关系判定的SVM算法[J]. 计算机工程与应用, 2021, 57(20): 104-108.
[9]	高晋，赵云芃，Godfred Kim Mensah，李欣芸，刘志芬，陈俊杰，郭浩. 静息态功能脑连接的空间动态分析及分类研究[J]. 计算机工程与应用, 2021, 57(2): 150-155.
[10]	秦博宇，郝晓燕，刘永芳. 基于SVM和CRF双层模型的FrameNet框架消歧[J]. 计算机工程与应用, 2021, 57(18): 255-262.
[11]	郑淋文，周金治，黄静. 深度稀疏自编码器在ECG特征提取中的应用[J]. 计算机工程与应用, 2021, 57(11): 156-161.
[12]	温廷新，孔祥博. 不平衡样本下的金融市场极端风险预警研究[J]. 计算机工程与应用, 2020, 56(8): 256-260.
[13]	陈菲雨，岳文斌，饶颖露，邢金昊，马晓静. 基于改进TLD算法的无人机自主精准降落[J]. 计算机工程与应用, 2020, 56(7): 247-254.
[14]	曾春艳，马超峰，王志锋，朱栋梁，赵楠，王娟，刘聪. 深度学习框架下说话人识别研究综述[J]. 计算机工程与应用, 2020, 56(7): 8-16.
[15]	马玲，罗晓曙，蒋品群. 基于模板匹配和支持向量机的点阵字符识别研究[J]. 计算机工程与应用, 2020, 56(4): 134-139.

一种概率序列核在说话人识别中的应用

Probabilistic sequence kernel for speaker recognition

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics