面向哈萨克语LVCSR的语言模型构建方法研究

计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (24): 178-181.

面向哈萨克语LVCSR的语言模型构建方法研究

达吾勒·阿布都哈依尔，努尔买买提·尤鲁瓦斯，刘艳

新疆大学信息科学与工程学院，乌鲁木齐 830046

出版日期:2016-12-15 发布日期:2016-12-20

On language model construction for LVCSR in Kazakh

Dawel Abilhayer, Nurmemet Yolwas, LIU Yan

College of Information Science and Engineering, Xinjiang University, Urumqi 830046, China

Online:2016-12-15 Published:2016-12-20

摘要/Abstract

摘要： 一个好的语言模型不仅可以压缩语音识别过程中的搜索空间，而且还可以提高识别准确率。N-gram统计语言模型是目前广泛使用的语言模型之一。从文本的收集和处理开始，介绍了哈萨克语语言模型的构建相关技术，并以此为基础实现了一个哈萨克语连续语音识别基线系统。分别训练了基于单词和基于音节的3-gram语言模型，并通过困惑度及连续语言实验结果对两种语言模型进行了评价。

关键词: 哈萨克语, 语言模型, 语音识别, 语料库构建, 文本处理

Abstract: A good language model not only compresses the search space for speech recognition process, but also improves the recognition accuracy. N-gram statistical language model is one of the widely used language models. This paper starts from the collection and processing of the text, introduces the construction technology of Kazakh language model. On?this?basis?a Kazakh continuous speech recognition baseline system?is?implemented. It trains the 3-gram language model based on word and syllable respectively, and then the two language models are evaluated by the result of perplexity and continuous language experiment.

Key words: Kazakh language, language model, Automatic Speech Recognition（ASR）, corpus creation, text processing

达吾勒·阿布都哈依尔，努尔买买提·尤鲁瓦斯，刘艳. 面向哈萨克语LVCSR的语言模型构建方法研究[J]. 计算机工程与应用, 2016, 52(24): 178-181.

Dawel Abilhayer, Nurmemet Yolwas, LIU Yan. On language model construction for LVCSR in Kazakh[J]. Computer Engineering and Applications, 2016, 52(24): 178-181.

[1]	姚贵斌，张起贵. 基于XLnet语言模型的中文命名实体识别[J]. 计算机工程与应用, 2021, 57(18): 156-162.
[2]	余同瑞，金冉，韩晓臻，李家辉，郁婷. 自然语言处理预训练模型的研究综述[J]. 计算机工程与应用, 2020, 56(23): 12-22.
[3]	娄英丹，徐静林，黄丽霞，张雪英. MLLR和MAP在远场噪声混响下的语音识别研究[J]. 计算机工程与应用, 2020, 56(10): 122-126.
[4]	赵悦，李要嫱，徐晓娜，吴立成. 临近最优主动学习的藏语语音识别方法研究[J]. 计算机工程与应用, 2018, 54(22): 156-159.
[5]	黄晓辉1，2，李京1，马睿2，3. 藏语口语语音语料库的设计与研究[J]. 计算机工程与应用, 2018, 54(13): 231-235.
[6]	宋春晓，孙颖. 面向情感语音识别的非线性几何特征提取算法[J]. 计算机工程与应用, 2017, 53(20): 128-133.
[7]	常静雅，张晓俊，顾玲玲，袁悦，顾济华，陶智. 小波域能量谱和非线性降维的病理嗓音识别[J]. 计算机工程与应用, 2017, 53(2): 166-171.
[8]	黄丽霞1，王亚楠1，张雪英1，王洪翠2. 基于深度自编码网络语音识别噪声鲁棒性研究[J]. 计算机工程与应用, 2017, 53(13): 49-54.
[9]	赵彩光，张树群，雷兆宜. 基于并行回火改进的GRBM的语音识别[J]. 计算机工程与应用, 2016, 52(8): 125-129.
[10]	晁浩，宋成，薛霄，刘志中. 基于模型自适应的声效鲁棒性语音识别算法[J]. 计算机工程与应用, 2016, 52(2): 156-160.
[11]	方刚1，张社民2. 三元统计语言模型对基因表达载体设计的优化[J]. 计算机工程与应用, 2016, 52(15): 60-64.
[12]	晁浩. 融合音素串编辑距离的随机段模型解码算法[J]. 计算机工程与应用, 2015, 51(6): 208-211.
[13]	古丽扎达·海沙1，古丽拉·阿东别克2，3. 哈萨克语动词短语自动识别研究与实现[J]. 计算机工程与应用, 2015, 51(2): 218-223.
[14]	王秀珍，丛瑞，王飞. 一种面向在线查询的拼写纠错算法[J]. 计算机工程与应用, 2015, 51(14): 113-119.
[15]	王路露1，夏旭2，冯璐1，刘光灿1. 基于频谱方差和谱减法的语音端点检测新算法[J]. 计算机工程与应用, 2014, 50(8): 194-197.