计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (26): 144-146.DOI: 10.3778/j.issn.1002-8331.2009.26.042
田生伟1,吐尔根·依布拉音1,禹 龙2,买合木提·木合买提1,艾山·吾买尔1
TIAN Sheng-wei1,Turgun Ibrahim1,YU Long2,Mahmut Muhammad1,Hasan Uma1
摘要: 基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语句子相似度的计算方法,采用的基于词形特征的粗选算法、散列单词倒排索引能够有效提高算法的查找速度,快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法,可以有效衡量两个维吾尔语句子的相似程度,实验结果证明算法是有效的。
中图分类号: