基于最大熵模型和规则的中文姓名识别

计算机工程与应用 ›› 2007, Vol. 43 ›› Issue (35): 1-4.

基于最大熵模型和规则的中文姓名识别

贾宁^1,2,张全²

1.中国科学院研究生院，北京 100039
2.中国科学院声学研究所，北京 100080

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-12-11 发布日期:2007-12-11
通讯作者: 贾宁

Identification of Chinese names based on maximum entropy model and rules

JIA Ning^1,2,ZHANG Quan²

1.Graduate School of Chinese Academy of Sciences，Beijing 100039，China
2.Institute of Acoustics，Chinese Academy of Sciences，Beijing 100080，China

Received:1900-01-01 Revised:1900-01-01 Online:2007-12-11 Published:2007-12-11
Contact: JIA Ning

摘要/Abstract

摘要： 中文姓名识别是中文信息处理的一项重要技术，识别的召回率对其它需要以姓名识别为基础的中文信息处理技术有至关重要的影响。提出了一种统计模型和处理规则相结合的中文姓名识别方法：首先以最大熵模型识别潜在姓氏，而后再通过判定规则作进一步处理。真实语料的开放测试表明，该方法在召回率方面有明显的优势，可以达到94%以上的召回率，同时能保证较高的准确率。

关键词: 中文姓名识别, 最大熵, 规则

Abstract: Identification of Chinese names is one of the important fields for the Chinese language automatic processing.The recall rate of identification will affect other processing deeply.But most methods can’t get a good recall rate which is up to 90%.This paper presents a method based on maximum entropy model and rules.The open test on real corpus shows that the recall rate of the system reaches 94%，with a precision more than 84%.The method is practicable，and benefits from its recall rate.

Key words: Chinese name recognition, maximum entropy, rule

贾宁^1,2,张全²

. 基于最大熵模型和规则的中文姓名识别[J]. 计算机工程与应用, 2007, 43(35): 1-4.

JIA Ning^1,2,ZHANG Quan². Identification of Chinese names based on maximum entropy model and rules[J]. Computer Engineering and Applications, 2007, 43(35): 1-4.

[1]	刘藤，陈恒，李冠宇. 联合FOL规则的知识图谱表示学习方法[J]. 计算机工程与应用, 2021, 57(4): 100-107.
[2]	宋浩楠，赵刚，王兴芬. 融合知识表示和深度强化学习的知识推理方法[J]. 计算机工程与应用, 2021, 57(19): 189-197.
[3]	童文林，陈德旺，黄允浒，吕宜生. 结合模拟退火与规则约简的模糊系统优化方法[J]. 计算机工程与应用, 2021, 57(16): 142-150.
[4]	孟晓娟，张月琴，郝晓丽，吕进来. 多分类深度卷积生成对抗网络的皮带撕裂检测[J]. 计算机工程与应用, 2021, 57(16): 269-275.
[5]	张振海，张湘婷. 上下文感知的高铁信息服务推荐方法研究[J]. 计算机工程与应用, 2021, 57(12): 231-236.
[6]	杨葛英，沈夏炯，史先进，张磊. 以概念格为背景的关联规则可视化[J]. 计算机工程与应用, 2021, 57(1): 84-91.
[7]	袁顺杰，程辉，叶贞成，程培鑫. SOM-T2 FLS在股市预测中的应用研究[J]. 计算机工程与应用, 2020, 56(7): 130-136.
[8]	杜雨菲，吴保国，陈栋. 基于产生式规则的乔灌木识别推理算法研究[J]. 计算机工程与应用, 2020, 56(5): 242-250.
[9]	李建，习文风. 钻井液设计专家系统规则库的检测算法[J]. 计算机工程与应用, 2020, 56(4): 256-261.
[10]	纪文璐，王海龙，苏贵斌，柳林. 基于关联规则算法的推荐方法研究综述[J]. 计算机工程与应用, 2020, 56(22): 33-41.
[11]	王卉，李英顺. 改进型证据更新规则的动态故障诊断算法[J]. 计算机工程与应用, 2020, 56(2): 261-265.
[12]	顾军华，苏鸣，张亚娟，张丹红. 基于位编码链表的快速频繁模式挖掘算法研究[J]. 计算机工程与应用, 2020, 56(19): 86-93.
[13]	张孝，孙一铭，吴旭峰. 查询感知的关系-图数据库自适应存储技术研究[J]. 计算机工程与应用, 2020, 56(17): 100-108.
[14]	杨颖，王珺，王刚. 基于改进的Random Subspace的客户投诉分类方法[J]. 计算机工程与应用, 2020, 56(13): 230-235.
[15]	周婉莹，马盈仓，续秋霞，郑毅. 最大熵和[l2,0]范数约束的无监督特征选择算法[J]. 计算机工程与应用, 2020, 56(11): 51-59.