基于频域时域联合分析的语音端点检测

计算机工程与应用 ›› 2012, Vol. 48 ›› Issue (34): 144-147.

• 数据库、信号与信息处理 • 上一篇下一篇

基于频域时域联合分析的语音端点检测

王坤赤，袁燕，王建强，张裕胜，杨永杰

南通大学电子信息学院，江苏南通 226019

出版日期:2012-12-01 发布日期:2012-11-30

Speech endpoint detection based on frequency domain and time domain analyses

WANG Kunchi, YUAN Yan, WANG Jianqiang, ZHANG Yusheng, YANG Yongjie

Department of Electrical Information, Nantong University, Nantong, Jiangsu 226019, China

Online:2012-12-01 Published:2012-11-30

摘要/Abstract

摘要： 通过计算语音频谱上谐波基频能量，在频域上检测浊音信号。因谐波频谱是乐音的基本特征，所以这种算法可以有效地消除各种非乐音噪音信号的影响，具有较高灵敏度和准确性。根据检测到的浊音位置和基频值，利用语音信号时域短时平稳特性，在时域上应用互相关系数确定相邻基音节，进而精确检测浊音信号的起始和终止端点。根据清音频率较高的特点，先对语音信号通过二阶微分提升高频能量。应用Teager能量算子可以同时分析能量和频率变化的特点检测纯净语音信号中清音的起始和终止端点。实验研究结果表明语音端点检测算法具有较高的可靠性和精确性。

关键词: 谐波, 互相关函数, Teager能量算子

Abstract: In frequency domain voice activity is detected with the spectral harmonic energy of fundamental wave. The algorithm can effectively eliminate noises of sorts, for harmonics only appear in spectrum of musical tone. So the algorithm is sensitive and accurate. In time domain every pitch is detected by cross-correlation function in virtue of the time of voice activity and fundamental frequency that is obtained through voice activity detection. So the sonant boundary is precisely detected. Second order difference enhances the high frequency component of signal, and cross-correlation function is used to trace the energy of unvoiced sound. Experiments show that the algorithm is reliable and accurate.

Key words: harmonic, cross-correlation function, Teager energy operator

王坤赤，袁燕，王建强，张裕胜，杨永杰. 基于频域时域联合分析的语音端点检测[J]. 计算机工程与应用, 2012, 48(34): 144-147.

WANG Kunchi, YUAN Yan, WANG Jianqiang, ZHANG Yusheng, YANG Yongjie. Speech endpoint detection based on frequency domain and time domain analyses[J]. Computer Engineering and Applications, 2012, 48(34): 144-147.

[1]	李强，于凤芹. 一种改进的基于音高显著性的旋律提取算法[J]. 计算机工程与应用, 2019, 55(3): 115-119.
[2]	王杰1，杨程程1，莫嘉永2，王敦泽1，王谢谢1. 谐波重构先验信噪比估计算法[J]. 计算机工程与应用, 2018, 54(7): 44-48.
[3]	郭瑞，樊亚敏. 极限学习机延拓的BS-EMD端点效应抑制算法及应用[J]. 计算机工程与应用, 2017, 53(7): 256-262.
[4]	高启航1，2，杨卫东1，2. 基于互相关的二阶段时间序列聚类方法[J]. 计算机工程与应用, 2016, 52(19): 12-18.
[5]	陆建龙1，魏建勋2，黄辉先1，彭一芯1，方鑫1. 基于提升小波变换的在线谐波检测[J]. 计算机工程与应用, 2016, 52(14): 50-53.
[6]	关维国1，姚清志1，鲁宝春2. 微电网HHT谐波检测与时频分析方法[J]. 计算机工程与应用, 2015, 51(20): 198-202.
[7]	郭冀岭，肖建，邱忠才. 七相感应电机缺相时消除谐波的矢量控制研究[J]. 计算机工程与应用, 2015, 51(19): 236-241.
[8]	李葵，范玉刚，吴建德. 基于SVD和TKEO的轴承振动信号特征提取[J]. 计算机工程与应用, 2014, 50(17): 195-199.
[9]	祝鹏，王成儒. 小波包变换与Teager能量算子结合的说话人识别[J]. 计算机工程与应用, 2013, 49(9): 187-189.
[10]	季伟，林卫星，黄伟锋. 基于DSP产生的SPWM波的谐波估计与分析[J]. 计算机工程与应用, 2013, 49(9): 211-217.
[11]	张晓威，孟凡明. 正弦信号幅值和初相位估计的问题研究[J]. 计算机工程与应用, 2013, 49(5): 216-219.
[12]	高正龙1,吴涛1，2，陈小波1，杨莹莹1. 图像滤波的商空间粒计算算法[J]. 计算机工程与应用, 2013, 49(24): 182-185.
[13]	朱琴跃，王俊哲，刘爱雷. CRH1与CRH2动车组牵引变流器性能比较与优化[J]. 计算机工程与应用, 2013, 49(21): 255-261.
[14]	李杰1，周萍2，杜志然1. 短时TEO能量在带噪语音端点检测中的应用[J]. 计算机工程与应用, 2013, 49(12): 144-147.
[15]	李冰，夏秀渝，申庆超，周宁. 基于过零点双耳时间差的运动声源定位[J]. 计算机工程与应用, 2012, 48(9): 127-130.

基于频域时域联合分析的语音端点检测

Speech endpoint detection based on frequency domain and time domain analyses

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics