计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (20): 116-118.DOI: 10.3778/j.issn.1002-8331.2010.20.033
梁建娟1,朱碧兰2,刘本永1,中川正樹2
1.贵州大学 计算机科学与信息学院,贵阳 550025
2.日本东京农工大学,日本 东京 184-8588
LIANG Jian-juan1,ZHU Bi-lan2,LIU Ben-yong1,NAKAGAWA Masaki2
摘要: 研究了一种有效的词典驱动的联机手写日文病名识别方法。病名词典以树结构存储,包含21 713个病名短语。在切分中,手写病名字符串通过分析相邻笔划之间的空间信息等特征被切分为原始的片段序列。连续的片段动态地合并为候选字符模式,不同的合并方式产生不同的候选字符序列,这样可构成一个切分候选网格。在识别过程中,结合病名词典匹配来限制候选字符模式的类别扩展,采用集束搜索策略来寻找到一条最优路径作为识别结果。用500个实际的手写病名样本做实验,平均每个病名的识别时间为0.87 s,识别正确率为83.16%。
中图分类号: