计算机工程与应用 ›› 2013, Vol. 49 ›› Issue (22): 150-154.
米日古力·阿布都热素,米吉提·阿不力米提,艾克白尔·帕塔尔,艾斯卡尔·艾木都拉
Mirigul ABDURSUL, Mijit ABLIMIT, Akbar PATTAR, Askar HAMDULLA
摘要: 以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。