计算机工程与应用 ›› 2011, Vol. 47 ›› Issue (31): 125-127.
尤慧丽,晏 立,杨晓东
YOU Huili,YAN Li,YANG Xiaodong
摘要: 针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提取歧义字段的上下文信息来建立规则库,然后利用C-SVM模型结合规则对组合型歧义字段进行歧义消解。最后以1998年1月《人民日报》语料中出现的组合型歧义字段进行训练和测试,实验显示消歧的平均准确率达89.33%。