计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (15): 118-120.DOI: 10.3778/j.issn.1002-8331.2010.15.035
艾山·吾买尔,吐尔根·依步拉音,早克热·卡德尔
AISHAN Wumaier,TUERGEN Yibulayin,ZAOKERE Kadeer
摘要: 维吾尔语单词连接构形词缀时,经常发生元音弱化成央音的现象。但对已有形态变化的单词进行形态还原时,使用规则识别弱化央音的原音的效率一般在40%左右。提出基于噪声信道的维吾尔语央音原音识别模型。该模型以弱化词干词尾的二字符、三字符和最后音节作为上下文,建立语言模型和似然度计算公式。在开放测试中,模型的准确率达到82.45%,提高词干提取准确率15%。
中图分类号: