基于噪声信道的维吾尔语央音原音识别模型

doi:10.3778/j.issn.1002-8331.2010.15.035

计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (15): 118-120.DOI: 10.3778/j.issn.1002-8331.2010.15.035

• 数据库、信号与信息处理 • 上一篇下一篇

基于噪声信道的维吾尔语央音原音识别模型

艾山·吾买尔，吐尔根·依步拉音，早克热·卡德尔

新疆大学信息科学与工程学院，乌鲁木齐 830046

收稿日期:2009-04-27 修回日期:2009-06-18 出版日期:2010-05-21 发布日期:2010-05-21
通讯作者: 艾山·吾买尔

Noisy channel based Uyghur neutralized vowel identification model

AISHAN Wumaier，TUERGEN Yibulayin，ZAOKERE Kadeer

School of Information Science and Engineering，Xinjiang University，Urumqi 830046，China

Received:2009-04-27 Revised:2009-06-18 Online:2010-05-21 Published:2010-05-21
Contact: AISHAN Wumaier

摘要/Abstract

摘要： 维吾尔语单词连接构形词缀时，经常发生元音弱化成央音的现象。但对已有形态变化的单词进行形态还原时，使用规则识别弱化央音的原音的效率一般在40%左右。提出基于噪声信道的维吾尔语央音原音识别模型。该模型以弱化词干词尾的二字符、三字符和最后音节作为上下文，建立语言模型和似然度计算公式。在开放测试中，模型的准确率达到82.45%，提高词干提取准确率15%。

关键词: 噪声信道, 维吾尔语, 元音弱化, 词干提取, 央音

Abstract: In Uyghur，an inflectional suffix added to a word always produces vowel neutralization.When stemming an inflected word，the rule based neutralized vowel detecting has a low precision about 40%.For this problem，the noisy channel based Uyghur neutralized vowel identification model is proposed.The language model and likelihood build on the word ending two letters，three letters and last syllable.In the test，the model’s precision reached 82.45%，this model can improve stemming precision over 15%.

Key words: noisy channel, Uyghur, vowel harmony, stemming, neutralized vowel

中图分类号:

TP391

艾山·吾买尔，吐尔根·依步拉音，早克热·卡德尔. 基于噪声信道的维吾尔语央音原音识别模型[J]. 计算机工程与应用, 2010, 46(15): 118-120.

AISHAN Wumaier，TUERGEN Yibulayin，ZAOKERE Kadeer. Noisy channel based Uyghur neutralized vowel identification model[J]. Computer Engineering and Applications, 2010, 46(15): 118-120.

[1]	刘畅，阿布都克力木·阿布力孜，姚登峰，哈里旦木·阿布都克里木. 维吾尔语形态分析研究综述[J]. 计算机工程与应用, 2021, 57(15): 42-61.
[2]	阿里甫·库尔班1，艾山江·亚生2，张丹丹2. 维吾尔语KP_V句型的文法手语编辑系统的设计[J]. 计算机工程与应用, 2019, 55(7): 248-252.
[3]	魏春英，郭中华. 基于联合信源信道和迭代解码的LDPC编码方案[J]. 计算机工程与应用, 2019, 55(16): 94-98.
[4]	帕丽旦·木合塔尔，吾守尔·斯拉木，买买提阿依甫，努尔麦麦提·尤鲁瓦斯. RNN编码器-解码器在维汉机器翻译中的应用[J]. 计算机工程与应用, 2018, 54(15): 235-240.
[5]	姑丽加玛丽·麦麦提艾力1，艾斯卡尔·肉孜2，艾斯卡尔·艾木都拉3. 分层特征模板筛选的维吾尔语韵律边界预测[J]. 计算机工程与应用, 2017, 53(8): 250-253.
[6]	年梅1，范祖奎2，刘若兰1. 维吾尔语褒贬情感词典构建研究[J]. 计算机工程与应用, 2017, 53(4): 152-155.
[7]	徐春1，2，3，杨勇4，蒋同海1. 基于机器翻译的维吾尔语形态分析研究[J]. 计算机工程与应用, 2017, 53(14): 138-142.
[8]	阿力木江·艾沙1，3，库尔班·吾布力2，3，吐尔根·依布拉音2，3. 维吾尔文Bigram文本特征提取[J]. 计算机工程与应用, 2015, 51(3): 216-221.
[9]	金惠琴，努尔麦麦提·尤鲁瓦斯，吾守尔·斯拉木，王辉. 维吾尔语的重音检测[J]. 计算机工程与应用, 2014, 50(9): 197-199.
[10]	阿力木·木拉提，艾孜尔古丽，玉素甫·艾白都拉. 现代维吾尔语人名汉字音译转写关键技术研究[J]. 计算机工程与应用, 2014, 50(9): 209-213.
[11]	麦热哈巴·艾力1，2，阿孜古丽·夏力甫3，吐尔根·依布拉音1，2. 维吾尔语多词表达抽取方法研究[J]. 计算机工程与应用, 2014, 50(8): 26-30.
[12]	艾孜尔古丽1，2，李晓1，玉素甫·艾白都拉2. 中小学维吾尔语文教材用词数据分析方法研究[J]. 计算机工程与应用, 2014, 50(3): 108-111.
[13]	努尔麦麦提·尤鲁瓦斯，吾守尔·斯拉木. 面向大词汇量的维吾尔语连续语音识别研究[J]. 计算机工程与应用, 2013, 49(9): 115-119.
[14]	米日古力·阿布都热素，米吉提·阿不力米提，艾克白尔·帕塔尔，艾斯卡尔·艾木都拉. 基于HTK的维吾尔语连续音素识别技术研究[J]. 计算机工程与应用, 2013, 49(22): 150-154.
[15]	努尔麦麦提·尤鲁瓦斯，吾守尔·斯拉木. 维吾尔语连续语音识别声学模型优化研究[J]. 计算机工程与应用, 2013, 49(2): 145-147.

基于噪声信道的维吾尔语央音原音识别模型

Noisy channel based Uyghur neutralized vowel identification model

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics