计算机工程与应用 ›› 2022, Vol. 58 ›› Issue (20): 165-173.DOI: 10.3778/j.issn.1002-8331.2103-0328
杨涛,解庆,刘永坚,刘平峰
YANG Tao, XIE Qing, LIU Yongjian, LIU Pingfeng
摘要: 长文本摘要生成一直是自动摘要领域的难题。现有方法在处理长文本的过程中,存在准确率低、冗余等问题。鉴于主题模型在多文档摘要中的突出表现,将其引入到长文本摘要任务中。另外,目前单一的抽取式或生成式方法都无法应对长文本的复杂情况。结合两种摘要方法,提出了一种针对长文本的基于主题感知的抽取式与生成式结合的混合摘要模型。并在TTNews和CNN/Daily Mail数据集上验证了模型的有效性,该模型生成摘要ROUGE分数与同类型模型相比提升了1~2个百分点,生成了可读性更高的摘要。