计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (8): 149-157.DOI: 10.3778/j.issn.1002-8331.1901-0043
张敏,曾碧卿,韩旭丽,徐如阳
ZHANG Min, ZENG Biqing, HAN Xuli, XU Ruyang
摘要:
基于注意力机制的序列到序列模型在生成式摘要方法中得到广泛应用,并取得较好的表现。但现有模型方法生成的摘要普遍存在语义无关、句内重复和未登录词等问题。为了解决这些问题,在典型基于注意力机制的序列到序列模型基础上,提出了结合双注意力和指针覆盖机制的生成式文本摘要方法DAPC(Dual Attention and Pointer-Coverage based model)模型。组合局部注意力和卷积神经网络,提取输入文本的更高层次的语言特征;引入指针-生成网络来解决未登录词问题;使用覆盖机制解决模型生成摘要句内重复的问题。实验结果表明,模型在CNN/Daily Mail数据集中有较好的表现。