基于HTK的维吾尔语连续音素识别技术研究

计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (22): 150-154.

• 数据库、数据挖掘、机器学习 • 上一篇下一篇

基于HTK的维吾尔语连续音素识别技术研究

米日古力·阿布都热素，米吉提·阿不力米提，艾克白尔·帕塔尔，艾斯卡尔·艾木都拉

新疆大学信息科学与工程学院，乌鲁木齐 830046

出版日期:2013-11-15 发布日期:2013-11-15

Research on technologies of HTK based Uyghur continuous phoneme recognition

Mirigul ABDURSUL, Mijit ABLIMIT, Akbar PATTAR, Askar HAMDULLA

College of Information Science and Engineering, Xinjiang University, Urumqi 830046, China

Online:2013-11-15 Published:2013-11-15

摘要/Abstract

摘要： 以建立维吾尔语连续音素识别基础平台为目标，在HTK（基于隐马尔可夫模型的工具箱）的基础上，首次研究了其语言相关环节的几项关键技术；结合维吾尔语的语言特征，完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计；根据具体技术指标，录制了较大规模语音语料库；确定音素作为基元，训练了维吾尔语声学模型；在基于字母的N-gram语言模型下，得出了从语音句子向字母序列句子的识别结果；统计了维吾尔语32个音素的识别率，给出了容易混淆的音素及其根源分析，为进一步提高识别率奠定了基础。

关键词: 维吾尔语, 声学模型, 语言模型, 维吾尔语音素, 基于隐马尔可夫模型的工具箱（HTK）

Abstract: In this paper, HTK （Hidden Markov model-based Toolkit） based Uyghur continuous phoneme recognition baseline system is presented, and its several language-depended key technologies are addressed. According to the characteristics of Uyghur language, it designs the text corpus for language modeling and speech corpus construction, and records a large-scale speech data for training the phoneme based Uyghur acoustic model. The different recognition rates with different N-gram language models are also given. The statistics of the recognition rates of 32 Uyghur phonemes, the list of the confused phonemes and their possible reasons are analyzed. And then it gives some research directions for further improvements to the baseline system.

Key words: Uyghur language, acoustic model, language model, Uyghur phoneme, Hidden Markov model-based Toolkit（HTK）

米日古力·阿布都热素，米吉提·阿不力米提，艾克白尔·帕塔尔，艾斯卡尔·艾木都拉. 基于HTK的维吾尔语连续音素识别技术研究[J]. 计算机工程与应用, 2013, 49(22): 150-154.

Mirigul ABDURSUL, Mijit ABLIMIT, Akbar PATTAR, Askar HAMDULLA. Research on technologies of HTK based Uyghur continuous phoneme recognition[J]. Computer Engineering and Applications, 2013, 49(22): 150-154.

[1]	张小峰，谢钧，罗健欣，杨涛. 深度学习语音合成技术综述[J]. 计算机工程与应用, 2021, 57(9): 50-59.
[2]	姚贵斌，张起贵. 基于XLnet语言模型的中文命名实体识别[J]. 计算机工程与应用, 2021, 57(18): 156-162.
[3]	刘畅，阿布都克力木·阿布力孜，姚登峰，哈里旦木·阿布都克里木. 维吾尔语形态分析研究综述[J]. 计算机工程与应用, 2021, 57(15): 42-61.
[4]	余同瑞，金冉，韩晓臻，李家辉，郁婷. 自然语言处理预训练模型的研究综述[J]. 计算机工程与应用, 2020, 56(23): 12-22.
[5]	阿里甫·库尔班1，艾山江·亚生2，张丹丹2. 维吾尔语KP_V句型的文法手语编辑系统的设计[J]. 计算机工程与应用, 2019, 55(7): 248-252.
[6]	蔡文彬1，魏云龙1，徐海华2，潘林1. 混合单元选择语音合成系统的目标代价构建[J]. 计算机工程与应用, 2018, 54(24): 20-25.
[7]	帕丽旦·木合塔尔，吾守尔·斯拉木，买买提阿依甫，努尔麦麦提·尤鲁瓦斯. RNN编码器-解码器在维汉机器翻译中的应用[J]. 计算机工程与应用, 2018, 54(15): 235-240.
[8]	姑丽加玛丽·麦麦提艾力1，艾斯卡尔·肉孜2，艾斯卡尔·艾木都拉3. 分层特征模板筛选的维吾尔语韵律边界预测[J]. 计算机工程与应用, 2017, 53(8): 250-253.
[9]	年梅1，范祖奎2，刘若兰1. 维吾尔语褒贬情感词典构建研究[J]. 计算机工程与应用, 2017, 53(4): 152-155.
[10]	王海坤，伍大勇，刘江，王士进，胡国平，胡郁. 基于时域建模的自动语音识别[J]. 计算机工程与应用, 2017, 53(20): 243-248.
[11]	徐春1，2，3，杨勇4，蒋同海1. 基于机器翻译的维吾尔语形态分析研究[J]. 计算机工程与应用, 2017, 53(14): 138-142.
[12]	达吾勒·阿布都哈依尔，努尔买买提·尤鲁瓦斯，刘艳. 面向哈萨克语LVCSR的语言模型构建方法研究[J]. 计算机工程与应用, 2016, 52(24): 178-181.
[13]	方刚1，张社民2. 三元统计语言模型对基因表达载体设计的优化[J]. 计算机工程与应用, 2016, 52(15): 60-64.
[14]	阿力木江·艾沙1，3，库尔班·吾布力2，3，吐尔根·依布拉音2，3. 维吾尔文Bigram文本特征提取[J]. 计算机工程与应用, 2015, 51(3): 216-221.
[15]	王秀珍，丛瑞，王飞. 一种面向在线查询的拼写纠错算法[J]. 计算机工程与应用, 2015, 51(14): 113-119.

基于HTK的维吾尔语连续音素识别技术研究

Research on technologies of HTK based Uyghur continuous phoneme recognition

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics