改进的自适应汉维句子对齐

计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (35): 147-149.

• 数据库、信号与信息处理 • 上一篇下一篇

改进的自适应汉维句子对齐

田生伟1，禹龙2，杨飞宇3

1.新疆大学软件学院，乌鲁木齐 830008
2.新疆大学网络中心，乌鲁木齐 830046
3.新疆大学国际文化交流学院，乌鲁木齐 830046

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2011-12-11 发布日期:2011-12-11

Improved adaptive algorithm for Chinese-Uyghur sentence alignment

TIAN Shengwei1，YU Long2，YANG Feiyu3

1.School of Software，Xinjiang University，Urumqi 830008，China
2.Network Center，Xinjiang University，Urumqi 830046，China
3.International Cultural Exchange College，Xinjiang University，Urumqi 830046，China

Received:1900-01-01 Revised:1900-01-01 Online:2011-12-11 Published:2011-12-11

摘要/Abstract

摘要： 提出了改进的自适应汉维句子对齐算法对齐汉维语句子。针对传统对齐方法不能较好地适应语料类型的变化，算法利用当前待对齐汉维文本的字节长度比和历史匹配模式数据，动态修正对齐模型的参数，使其适应语料类型的变化，提高了汉维句子对齐算法的性能，对齐的正确率和召回率较长度对齐模型分别提高了3.5个百分点和2.7个百分点，较混合对齐提高了1.9个百分点和1.8个百分点。实验结果验证了该算法能够有效地适应语料类型的变化。

关键词: 双语语料, 句子对齐, 自适应

Abstract: This paper proposes an improved adaptive algorithm for Chinese-Uyghur sentence alignment.Traditional alignment methods can not well adapt to change in types of corpus，the algorithm makes ues of current Chinese-Uyghur text length ratio of bytes and historical matching model，modifies the alignment model parameters dynamically to meet the changes in types of corpus and improves sentence alignment algorithm performance.Compared with alignment algorithm based on length，alignment improves alignment accuarcy 3.5 percentage and recall 2.7 percentage，compared with mixed-aligned model，alignment improves 1.9 percentage and 1.8 percentage.Experimental results show that the algorithm can adapt to change in types of corpus well.

Key words: bilingual corpora, sentence alignment, adaptive

田生伟1，禹龙2，杨飞宇3. 改进的自适应汉维句子对齐[J]. 计算机工程与应用, 2011, 47(35): 147-149.

TIAN Shengwei1，YU Long2，YANG Feiyu3. Improved adaptive algorithm for Chinese-Uyghur sentence alignment[J]. Computer Engineering and Applications, 2011, 47(35): 147-149.

[1]	马珺，王昱皓. 结合自适应更新策略和再检测技术的跟踪算法[J]. 计算机工程与应用, 2021, 57(9): 217-224.
[2]	张松灿，普杰信，司彦娜，孙力帆. 基于种群相似度的自适应改进蚁群算法及应用[J]. 计算机工程与应用, 2021, 57(8): 70-77.
[3]	邹杰，李俊. 多策略协方差矩阵学习差分进化算法[J]. 计算机工程与应用, 2021, 57(7): 78-87.
[4]	赵林锁，马瑞强，姜天，宋宝燕，潘一山. 两级回归的流式大数据事件自适应预警方法[J]. 计算机工程与应用, 2021, 57(7): 88-94.
[5]	卜冠南，刘建华，姜磊，张冬阳. 一种自适应分组的蚁群算法[J]. 计算机工程与应用, 2021, 57(6): 67-73.
[6]	倪宗军，陈辉，张昀，苏敏，郑秀娟. 自适应去噪的非接触式生理参数检测方法[J]. 计算机工程与应用, 2021, 57(5): 153-160.
[7]	陈世明，林子朋，高彦丽，裴惠琴. 自适应耦合权重下的异质群体一致性研究[J]. 计算机工程与应用, 2021, 57(4): 231-235.
[8]	王芙银，张德生，张晓. 结合鲸鱼优化算法的自适应密度峰值聚类算法[J]. 计算机工程与应用, 2021, 57(3): 94-102.
[9]	陈明月，刘三阳. 自适应流形学习在故障诊断中的应用[J]. 计算机工程与应用, 2021, 57(3): 247-252.
[10]	肖振久，孔祥旭，宗佳旭，杨玥莹. 自适应聚焦损失的图像目标检测算法[J]. 计算机工程与应用, 2021, 57(23): 185-192.
[11]	张忠林，赵昱，闫光辉. 自然邻居密度极值聚类算法[J]. 计算机工程与应用, 2021, 57(23): 200-210.
[12]	畅雅雯，赵冬青，单彦虎. 多特征融合和自适应聚合的立体匹配算法研究[J]. 计算机工程与应用, 2021, 57(23): 219-225.
[13]	李雅，侯彦东，刘畅. 基于故障程度的自适应优化容错控制[J]. 计算机工程与应用, 2021, 57(23): 295-302.
[14]	陈瑶，陈思. 基于自适应多普勒及动态邻域的改进BA算法[J]. 计算机工程与应用, 2021, 57(22): 166-176.
[15]	陈富健，谢维信，夏婷. 基于LCT+的自适应抗遮挡目标跟踪算法[J]. 计算机工程与应用, 2021, 57(22): 190-198.

改进的自适应汉维句子对齐

Improved adaptive algorithm for Chinese-Uyghur sentence alignment

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics