基于XLnet语言模型的中文命名实体识别

doi:10.3778/j.issn.1002-8331.2005-0355

计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (18): 156-162.DOI: 10.3778/j.issn.1002-8331.2005-0355

基于XLnet语言模型的中文命名实体识别

姚贵斌，张起贵

太原理工大学信息与计算机学院，山西晋中 030600

出版日期:2021-09-15 发布日期:2021-09-13

Chinese Named Entity Recognition Based on XLnet Language Model

YAO Guibin, ZHANG Qigui

School of Information and Computer, Taiyuan University of Technology, Jinzhong, Shanxi 030600, China

Online:2021-09-15 Published:2021-09-13

摘要/Abstract

摘要：

语言模型的建立对挖掘句子内部语义信息有着直接的影响，为了提高中文命名实体识别率，字的语义表示是关键所在。针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题，该文利用LSTM提取经过大规模语料预训练生成的字向量特征，同时将词向量预测矩阵传入到字向量特征提取阶段，通过矩阵运算融合为词向量特征，并进一步利用CNN提取词语之间的空间信息，将其与得到的词向量特征整合到一起输入语言模型XLnet（Generalized autoregressive pretraining for language understanding）中，然后经过BiGRU-CRF输出最优标签序列，提出了CAW-XLnet-BiGRU-CRF网络框架。并与其他的语言模型作了对比分析，实验结果表明，该框架解决了挖掘内部隐藏信息不充分问题，在《人民日报》1998年1月份数据集上的F1值达到了95.73%，能够较好地应用于中文命名实体识别任务。

关键词: 命名实体识别, 词向量, XLnet, 语言模型

Abstract:

The establishment of linguistic model has a direct impact on exploring the semantic information in sentences. To improve the recognition rate of Chinese named entities, the semantic representation of Chinese characters is the pointed. Aiming at the traditional Chinese named entity recognition algorithm has not fully tapped the hidden information inside the sentence, this article puts forward CAW-XLnet-BiGRU-CRF network framework by word-vector features generated by large-scale corpus pretraining with LSTM extract and uses CNN to extract spatial information between words, then integrates the extracted spatial information with the word vector features obtained and imports it into the language model XLnet （Generalized autoregressive pretraining for language understanding）, finally outputs the optimal tag sequence by BiGRU-CRF. The experiment result shows that the F1 value of the framework in the January 1998 data set of People’s Daily reachs 95.73% and solves the problem of hidden information inner, which can be well applied to Chinese named entity recognition task.

Key words: named entity recognition, word vector, XLnet, language model

姚贵斌，张起贵. 基于XLnet语言模型的中文命名实体识别[J]. 计算机工程与应用, 2021, 57(18): 156-162.

YAO Guibin, ZHANG Qigui. Chinese Named Entity Recognition Based on XLnet Language Model[J]. Computer Engineering and Applications, 2021, 57(18): 156-162.

[1]	杨倩，顾磊. 基于去噪字词联合模型的中文命名实体识别[J]. 计算机工程与应用, 2021, 57(7): 151-157.
[2]	程宇航，张健钦，李江川，张安. 交通行业事故文本数据的可视化挖掘分析方法[J]. 计算机工程与应用, 2021, 57(21): 116-122.
[3]	黄梅根，刘佳乐，刘川. 基于BERT的中文多关系抽取方法研究[J]. 计算机工程与应用, 2021, 57(21): 234-240.
[4]	隗昊，周爱，张益嘉，陈飞，屈雯，鲁明羽. 深度学习生物医学实体关系抽取研究综述[J]. 计算机工程与应用, 2021, 57(21): 14-23.
[5]	焦凯楠，李欣，朱容辰. 中文领域命名实体识别综述[J]. 计算机工程与应用, 2021, 57(16): 1-15.
[6]	何玉洁，杜方，史英杰，宋丽娟. 基于深度学习的命名实体识别研究综述[J]. 计算机工程与应用, 2021, 57(11): 21-36.
[7]	孙凌浩. 利用翻译模型的跨语言中文命名实体识别[J]. 计算机工程与应用, 2021, 57(10): 94-100.
[8]	曹军博，叶霞，许飞翔，尹列东. 改进的CBOW情感信息获取研究[J]. 计算机工程与应用, 2020, 56(9): 142-147.
[9]	李博，康晓东，张华丽，王亚鸽，陈亚媛，白放. 采用Transformer-CRF的中文电子病历命名实体识别[J]. 计算机工程与应用, 2020, 56(5): 153-159.
[10]	樊玮，刘欢，张宇翔. 融合词向量与位置信息的关键词提取算法[J]. 计算机工程与应用, 2020, 56(5): 179-185.
[11]	刘小安，彭涛. 基于卷积神经网络的中文景点识别研究[J]. 计算机工程与应用, 2020, 56(4): 140-145.
[12]	余同瑞，金冉，韩晓臻，李家辉，郁婷. 自然语言处理预训练模型的研究综述[J]. 计算机工程与应用, 2020, 56(23): 12-22.
[13]	蒋亚芳，严馨，李思远，徐广义，周枫. 多重CCA算法的柬汉双语词向量构建方法[J]. 计算机工程与应用, 2020, 56(17): 167-172.
[14]	陈泽宇，黄勃. 改进词向量模型的用户画像研究[J]. 计算机工程与应用, 2020, 56(1): 180-184.
[15]	马建红，张炳斐，张少光，刘双耀. 基于主动MCNN-SCRF的新能源汽车命名实体识别[J]. 计算机工程与应用, 2019, 55(7): 23-29.

基于XLnet语言模型的中文命名实体识别

Chinese Named Entity Recognition Based on XLnet Language Model

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics