基于小波包分析的鲁棒性语音识别

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (10): 124-126.

• 数据库、信号与信息处理 • 上一篇下一篇

基于小波包分析的鲁棒性语音识别

张君昌，李艳艳

西北工业大学电子信息学院，西安 710072

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-04-01 发布日期:2011-04-01

Robust speech recognition based on static and dynamic feature parameters

ZHANG Junchang，LI Yanyan

School of Electronics and Information，Northwestern Poly-technical University，Xi’an 710072，China

Received:1900-01-01 Revised:1900-01-01 Online:2011-04-01 Published:2011-04-01

摘要/Abstract

摘要： 通过对MFCC算法的研究，发现其中的FFT在整个时频空间使用固定的分析窗，这不符合语音信号的特性，而小波变换具有多分辨率特性，更符合人耳的听觉特性。提出了动静态特征参数结合的语音信号识别方法，首先在特征参数提取中引入了小波包变换，借助MFCC参数的提取方法，用小波包变换代替傅里叶变换和Mel滤波器组，提取了新的静态特征参数DWPTMFCC，然后把它与一阶DWPTMFCC差分参数相结合成一个向量，作为一帧语音信号的参数。仿真实验证明：基于新特征的识别率比原来MFCC的识别率有了很大提高，特别是在低信噪比情况下。

关键词: 语音识别, 小波包变换, 特征提取, Mel频率倒谱系数

Abstract: Through the analysis and research of Mel-Frequency Cepstral Coefficient（MFCC），can discover the limitation of using Fast Fourier Transform（FFT） which takes fix window width in the entire time and frequency space.It doesn’t match the characteristic of speech signal.But the wavelet transformation has the multi-resolution characteristic and can better conform to the auditory characteristic of human.This paper proposes a new speech recognition method DWPTMFCC of dynamic and static feature integration.Wavelet Packet Transformation（WPT） method is introduced to feature parameters in virtue of MFCC，then combines difference feature formed dynamic and static feature parameter integration.The simulation results show that the recognition rate is better using the new features than using MFCC in noise environment，especially in low SNR（Signal Noise Ratio）.

Key words: speech recognition, Wavelet Packet Transform（WPT）, feature extraction, Mel-Frequency Cepstral Coefficient（MFCC）

张君昌，李艳艳. 基于小波包分析的鲁棒性语音识别[J]. 计算机工程与应用, 2011, 47(10): 124-126.

ZHANG Junchang，LI Yanyan. Robust speech recognition based on static and dynamic feature parameters[J]. Computer Engineering and Applications, 2011, 47(10): 124-126.

[1]	包志强，邢瑜，吕少卿，黄琼丹. 改进YOLO V2的6D目标姿态估计算法[J]. 计算机工程与应用, 2021, 57(9): 148-153.
[2]	许德刚，王露，李凡. 深度学习的典型目标检测算法研究综述[J]. 计算机工程与应用, 2021, 57(8): 10-25.
[3]	胡文涛，陈秀宏. 基于邻域图的低秩投影学习[J]. 计算机工程与应用, 2021, 57(7): 209-214.
[4]	张晓丽，张魁星，江梅，魏本征，丛金玉. 淋巴瘤图像分类技术研究综述[J]. 计算机工程与应用, 2021, 57(6): 1-9.
[5]	熊健，覃仁超，何梦乙，刘建兰，唐风扬. 改进随机森林在Android恶意软件检测中的应用[J]. 计算机工程与应用, 2021, 57(3): 130-136.
[6]	李龙龙，何东健，王美丽. 基于改进型LBP算法的植物叶片图像识别研究[J]. 计算机工程与应用, 2021, 57(19): 228-234.
[7]	李杰，李苗，袁细国. 面向新一代测序数据的病原微生物检测算法[J]. 计算机工程与应用, 2021, 57(19): 282-289.
[8]	郭恒光，刘文彪，余仁波. 用于形状特征提取的spike函数[J]. 计算机工程与应用, 2021, 57(18): 220-226.
[9]	李振强，王树才，赵世达，白宇. 改进DeepLabv3+和XGBoost的羊骨架切割方法[J]. 计算机工程与应用, 2021, 57(18): 263-269.
[10]	刘星辰，贾俊铖，张莉，胡沁涵. 图像超分辨率特征浓缩网络[J]. 计算机工程与应用, 2021, 57(16): 213-219.
[11]	光睿智，安博文，潘胜达. 基于无锚框网络的航拍航道船舶检测算法[J]. 计算机工程与应用, 2021, 57(15): 251-258.
[12]	周小静，陈俊洪，杨振国，刘文印. 基于手势特征融合的操作动作识别[J]. 计算机工程与应用, 2021, 57(14): 169-175.
[13]	岳琪，徐忠亮，郭继峰. 面向混合乐器音乐分析的稀疏特征提取方法[J]. 计算机工程与应用, 2021, 57(14): 181-186.
[14]	谌贵辉，陈伍，李忠兵，易欣，刘会康，韩春阳. 残差卷积注意网络的图像超分辨率重建[J]. 计算机工程与应用, 2021, 57(12): 193-200.
[15]	郑淋文，周金治，黄静. 深度稀疏自编码器在ECG特征提取中的应用[J]. 计算机工程与应用, 2021, 57(11): 156-161.

基于小波包分析的鲁棒性语音识别

Robust speech recognition based on static and dynamic feature parameters

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics