摘要: 本文在对大规模姓名样本库、姓名语料库进行统计的基础上,将姓氏库中的姓氏按优先级分类,并研究了前300个姓氏作普通单字时其上下文用字规律,将确定真姓氏并识别姓名的过程看作对句子的姓氏用字集进行划分的过程,设计实现了一个中文姓名自动识别试验系统。同时提出多级阈值的概念,即姓名右边界阈值和识别阈值均是优先级的函数。对系统的开放测试召回率和准确率分别为80.62%、89.27%。
余祖波、高庆狮、方淼
.
中文姓名自动识别系统的设计与实现
[J]. 计算机工程与应用, 2006, 42(10): 5-.
ZuBo Yu,,. Design and Realization of Chinese Persons Name Automatic Recognition System[J]. Computer Engineering and Applications, 2006, 42(10): 5-.