计算机工程与应用 ›› 2022, Vol. 58 ›› Issue (13): 164-170.DOI: 10.3778/j.issn.1002-8331.2012-0301
魏鹏飞,曾碧,廖文雄
WEI Pengfei, ZENG Bi, LIAO Wenxiong
摘要: 讽刺是社会媒体中常用的修辞手法,在一些社交平台上(Twitter、Reddit)普遍存在,用比喻、夸张等方式对人或事进行否定、批评或嘲笑。讽刺检测任务对于理解人们实际的情感和信念至关重要。针对拥有会话上下文的目标文本进行讽刺检测,提出了一种基于RoBERTa的社交媒体会话中的讽刺检测模型。该模型主要由两个部分构成:前者是特征抽取层,采用更加鲁棒的迁移学习模型RoBERTa,对会话上下文文本和目标文本分别进行特征的学习;后者是特征融合层,由于目标文本是对会话上下文的回复,考虑到单纯的级联并不能很好地学习两者之间的对话关系,采用了改进版的attention-over-attention(AOA)注意力模型,使得目标文本可以关注到会话上下文中重要的信息。在公开的Twitter和Reddit两个数据集上进行了实验,验证了模型的有效性,还分析了对于目标文本的讽刺检测,有无会话上下文以及会话上下文数量的多少对模型性能的影响。