新疆非母语汉语语音识别中的字典自适应技术

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (21): 141-144.

• 数据库、信号与信息处理 • 上一篇下一篇

新疆非母语汉语语音识别中的字典自适应技术

李兵虎，黄浩

新疆大学信息科学与工程学院多语种信息实验室，乌鲁木齐 830046

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-07-21 发布日期:2011-07-21

Application of pronunciation dictionary adaptation for non-native mandarin speech recognition in Xinjiang

LI Binghu，HUANG Hao

Lab of Multi-lingual Information Technology，School of Information Science & Engineering，Xinjiang University，Urumqi 830046，China

Received:1900-01-01 Revised:1900-01-01 Online:2011-07-21 Published:2011-07-21

摘要/Abstract

摘要： 将标准普通话语音数据训练得到的声学模型应用于新疆维吾尔族说话人非母语汉语语音识别时，由于说话人的普通话发音存在较大偏误，将导致识别率急剧下降。针对这一问题，将多发音字典技术应用于新疆维吾尔族说话人汉语语音识别中，通过统计分析识别器的识别错误，建立音素混淆矩阵，获取音素的发音候选项。利用剪枝策略对发音候选项进行剪枝整合，扩展出符合维吾尔族说话人汉语发音规律的替代字典。对三种剪枝方法产生的发音字典的识别结果进行了对比。实验结果表明，使用相对最大剪枝策略产生的发音字典可以显著提高系统识别率。

关键词: 发音字典, 音素混淆矩阵, 剪枝策略, 新疆维吾尔族说话人, 非母语汉语语音识别

Abstract: When acoustic models trained on standard Mandarin speech database are applied to Putonghua speech uttered by Uighur speakers in Xinjiang，because of the significant pronunciation deviation of the speakers，recognition accuracy would drop dramatically.To solve this problem，the multi-pronunciation dictionary technique is adopted to improve the performance of non-native speech recognition.Statistical analysis of recognition errors is carried out to build phoneme confusion matrices from which pronunciation candidates can be made.Three pruning schemes are evaluated to best remove the useless pronunciation alternatives.The resulting pronunciation candidates are used to expand pronunciation dictionary for non-native speech recognition.Experimental results on continuous speech recognition show significant improvement can be obtained using resulting pronunciation dictionary.

Key words: pronunciation dictionary, phoneme confusion matrix, pruning strategy, Uighur speakers in Xinjiang, non-native Mandarin speech recognition

李兵虎，黄浩. 新疆非母语汉语语音识别中的字典自适应技术[J]. 计算机工程与应用, 2011, 47(21): 141-144.

LI Binghu，HUANG Hao. Application of pronunciation dictionary adaptation for non-native mandarin speech recognition in Xinjiang[J]. Computer Engineering and Applications, 2011, 47(21): 141-144.

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	29

	来源	本网站

	次数	29
	比例	100%

摘要

最新录用	在线预览	正式出版

0	0	68

	来源	本网站

	次数	68
	比例	100%

[1]	顾军华，苏鸣，张亚娟，张丹红. 基于位编码链表的快速频繁模式挖掘算法研究[J]. 计算机工程与应用, 2020, 56(19): 86-93.
[2]	高曼，韩萌，雷冰冰. 高效用模式产生策略综述[J]. 计算机工程与应用, 2020, 56(16): 1-12.
[3]	李艳，王阳阳，张红岩，武优西. 不可达顶点剪枝算法及其在最短路径中的应用[J]. 计算机工程与应用, 2020, 56(15): 51-57.
[4]	杨静雅，孙林夫，吴奇石. 基于汽车售后故障数据的关联分析[J]. 计算机工程与应用, 2019, 55(22): 219-224.
[5]	李光早，王士同. 基于骨干粒子群的弹性稀疏人脸识别[J]. 计算机工程与应用, 2017, 53(17): 143-148.
[6]	毛燠锋1，钱振兴2，万定生1，朱跃龙1. 基于条件函数依赖的CTANE算法研究与应用[J]. 计算机工程与应用, 2017, 53(11): 85-89.
[7]	张辉，柴毅. 一种改进的RBF神经网络参数优化方法[J]. 计算机工程与应用, 2012, 48(20): 146-149.
[8]	周贤善¹，杜友福¹，邵世煌²，余光柱². 高置信度关联规则的挖掘[J]. 计算机工程与应用, 2010, 46(24): 151-153.
[9]	巩固¹，黄永青¹，郝国生^1，2. 决策树算法的优化研究[J]. 计算机工程与应用, 2010, 46(13): 139-141.

新疆非母语汉语语音识别中的字典自适应技术

Application of pronunciation dictionary adaptation for non-native mandarin speech recognition in Xinjiang

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 9

编辑推荐 0

Metrics