计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (23): 163-169.DOI: 10.3778/j.issn.1002-8331.1809-0240
张金鹏,苏姣,杨蓓,张占
ZHANG Jinpeng, SU Jiao, YANG Bei, ZHANG Zhan
摘要: 双语人名对齐方法研究直接影响到跨语言信息处理的效果,由于泰语与汉语的发音差异大,汉泰双语平行语料库资源有限,基于统计的音译人名对齐模型难以解决汉泰双语人名对齐问题,提出一种在音译特征基础上融合人名知识分布特征相似性的汉泰双语人名对齐方法。计算双语人名音译相似度特征,通过卡方检验等计算汉语人名与泰语人名的知识分布相似度特征,借助支持向量机学习汉泰人名翻译对的两种特征生成人名翻译对分类器,对分类器分类结果调优生成对齐结果。实验结果表明该方法在汉泰人名发音差异大和缺少双语语料资源支持的情况下取得了较好效果。