计算机工程与应用 ›› 2009, Vol. 45 ›› Issue (4): 227-228.DOI: 10.3778/j.issn.1002-8331.2009.04.066
曹 波,苏一丹,邓 琦
CAO Bo,SU Yi-dan,DENG Qi
摘要: 用最大熵模型自动识别中国人名。首先对语料库的词性进行角色替换,然后用特征模板从角色替换后的语料库中提取出特征集,接着用IIS算法训练特征集的最大熵参数,最后用viterbi算法对初分词文本进行角色标注,并在角色序列的基础上进行模式最大匹配,从而实现中国人名的自动识别。在封闭测试实验中,识别准确率、召回率、F-值分别达到了85.4%、91.2%、88.2%。