计算机工程与应用 ›› 2022, Vol. 58 ›› Issue (6): 157-163.DOI: 10.3778/j.issn.1002-8331.2009-0494
曹渝昆,孙涛
CAO Yukun, SUN Tao
摘要: 事件信息抽取是信息抽取任务中的一种,旨在识别并提出一个事件的触发词和元素。由于容易受到数据稀疏的影响,事件要素的抽取是中文事件抽取任务中的一个难点,研究的重点在于特征工程的构建。中文语法相较英文要复杂许多,所以捕获英文文本特征的方法在中文任务中效果并不明显,而目前常用的神经网络模型仅考虑了上下文信息,不能兼顾词法和句法特征。因此针对中文的词法和句法特点,构建一种结合分组长短期记忆网络(grouped long-short term memory,GLSTM)和Attention的中文事件要素抽取方法AGCEE(attention and GLSTM based Chinese event extraction),通过Attention机制融合词特征和句子特征,采用GLSTM捕获句子的上下文信息,并通过条件随机场(conditional random fields,CRF)进行事件信息抽取,最后在公开数据集上进行实验以验证模型的有效性。