音素关联的多文种语音融合编码方法

计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (19): 217-221.

音素关联的多文种语音融合编码方法

孙广武，戴永，喻世东，李璇

湘潭大学智能计算与信息处理教育部重点实验室，湖南湘潭 411105

出版日期:2013-10-01 发布日期:2015-04-20

Phonemes associated multilingual speech fusion coding method

SUN Guangwu, DAI Yong, YU Shidong, LI Xuan

Key Laboratory of Intelligent Computing and Information Processing, Ministry of Education, Xiangtan University, Xiangtan, Hunan 411105, China

Online:2013-10-01 Published:2015-04-20

摘要/Abstract

摘要： 依据异类文种之间、同类文种不同语音之间存在音素数据关联的特性，提出多文种语音数据融合编码方法。将不同文种存在的相同音素数据段块按段块模板截取语音样本序列，小波变换，提取特征矢量，生成共享模板集；任意字音或语句音串均按共享模板集提供的元素进行编码与解码；以模板音素串构成的语音记录库按（音节、音素）索引。实验结果表明，单字语音数据压缩比、语音数据存储量、语音还原分段信噪比、主观评价得分等参数均明显优于已有方法，语音还原质量良好。

关键词: 语音, 音素, 关联, 多文种, 融合编码

Abstract: Multilingual speech data fusion coding method is proposed according to the phoneme data correlation properties, which exist among heterogeneous languages and different words in the same language. Voice sample sequences of the same phoneme data segment in different languages are intercepted according to the segment templates, wavelet transform is done to those sequences, then feature vectors is extracted to generate shared template sets. Speech data of any word or sentence are coded or decoded according to the template sets. The speech record database made up of template phoneme sets is indexed according to（syllable, phoneme） structure. The single word compression ratio, speech data size, segmental signal-to-noise ratio（SNRS） and score of subjective evaluation（MOS） are significantly better than existing methods, also the voice restoration is of good quality.

Key words: speech, phoneme, correlation, multilingual, fusion coding

孙广武，戴永，喻世东，李璇. 音素关联的多文种语音融合编码方法[J]. 计算机工程与应用, 2013, 49(19): 217-221.

SUN Guangwu, DAI Yong, YU Shidong, LI Xuan. Phonemes associated multilingual speech fusion coding method[J]. Computer Engineering and Applications, 2013, 49(19): 217-221.

[1]	张岐山，陈露露. 基于均衡接近度灰关联的Slope One算法[J]. 计算机工程与应用, 2021, 57(9): 96-102.
[2]	张小峰，谢钧，罗健欣，杨涛. 深度学习语音合成技术综述[J]. 计算机工程与应用, 2021, 57(9): 50-59.
[3]	牛通，卿粼波，许盛宇，苏婕. 基于深度学习的分层关联多行人跟踪[J]. 计算机工程与应用, 2021, 57(8): 96-102.
[4]	王传昱，李为相，陈震环. 基于语音和视频图像的多模态情感识别研究[J]. 计算机工程与应用, 2021, 57(23): 163-170.
[5]	惠蕙，王秋萍，李苗苗. 犹豫模糊语言后悔理论和ELECTRE决策方法及应用[J]. 计算机工程与应用, 2021, 57(20): 172-179.
[6]	王师琦，曾庆宁，龙超，熊松龄，祁潇潇. 语音增强与检测的多任务学习方法研究[J]. 计算机工程与应用, 2021, 57(20): 197-202.
[7]	朱永明，邱文静. 概率多值中智集的关联系数及其应用[J]. 计算机工程与应用, 2021, 57(15): 186-192.
[8]	张瑶，卢焕章，张路平，胡谋法. 基于深度学习的视觉多目标跟踪算法综述[J]. 计算机工程与应用, 2021, 57(13): 55-66.
[9]	张振海，张湘婷. 上下文感知的高铁信息服务推荐方法研究[J]. 计算机工程与应用, 2021, 57(12): 231-236.
[10]	车敏诗，聂春燕，杨承金，阮新磊，范如俊. 基于灰色关联法的生理信号与情绪关联度研究[J]. 计算机工程与应用, 2021, 57(11): 168-172.
[11]	杨葛英，沈夏炯，史先进，张磊. 以概念格为背景的关联规则可视化[J]. 计算机工程与应用, 2021, 57(1): 84-91.
[12]	肖成龙，聂紫阳，王珊珊. 基于ParetoHeu和实例化失败统计的关联启发式方法[J]. 计算机工程与应用, 2020, 56(5): 57-64.
[13]	李俊彦，宋焕生，张朝阳，侯景严，武非凡. 基于视频的多目标车辆跟踪及轨迹优化[J]. 计算机工程与应用, 2020, 56(5): 194-199.
[14]	王伟成，肖琨. 无线异构EH蜂窝网络中移动台关联的性能分析[J]. 计算机工程与应用, 2020, 56(3): 121-126.
[15]	纪文璐，王海龙，苏贵斌，柳林. 基于关联规则算法的推荐方法研究综述[J]. 计算机工程与应用, 2020, 56(22): 33-41.