计算机工程与应用 ›› 2010, Vol. 46 ›› Issue (13): 129-131.DOI: 10.3778/j.issn.1002-8331.2010.13.038
蒋文明,张雪英,李伯秋
JIANG Wen-ming,ZHANG Xue-ying,LI Bo-qiu
摘要: 由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文地址要素识别方法。实验证明,与基于特征字的规则方法相比,基于条件随机场的方法能够在较大程度上提高识别效果。由于条件随机场模型具有较好的泛化能力,该方法具有更强的通用性,特别适宜于大规模地址数据的批量解析和大众化位置服务中地址编码的快速处理。
中图分类号: