计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (24): 178-181.
达吾勒·阿布都哈依尔,努尔买买提·尤鲁瓦斯,刘 艳
Dawel Abilhayer, Nurmemet Yolwas, LIU Yan
摘要: 一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率。N-gram统计语言模型是目前广泛使用的语言模型之一。从文本的收集和处理开始,介绍了哈萨克语语言模型的构建相关技术,并以此为基础实现了一个哈萨克语连续语音识别基线系统。分别训练了基于单词和基于音节的3-gram语言模型,并通过困惑度及连续语言实验结果对两种语言模型进行了评价。