%0 Journal Article %A 郝超 %A 裘杭萍 %A 孙毅 %A 张超然 %T 多标签文本分类研究进展 %D 2021 %R 10.3778/j.issn.1002-8331.2101-0096 %J 计算机工程与应用 %P 48-56 %V 57 %N 10 %X

文本分类作为自然语言处理中一个基本任务,在20世纪50年代就已经对其算法进行了研究,现在单标签文本分类算法已经趋向成熟,但是对于多标签文本分类的研究还有很大的提升空间。介绍了多标签文本分类的基本概念以及基本流程,包括数据集获取、文本预处理、模型训练和预测结果。介绍了多标签文本分类的方法。这些方法主要分为两大类:传统机器学习方法和基于深度学习的方法。传统机器学习方法主要包括问题转换方法和算法自适应方法。基于深度学习的方法是利用各种神经网络模型来处理多标签文本分类问题,根据模型结构,将其分为基于CNN结构、基于RNN结构和基于Transfomer结构的多标签文本分类方法。对多标签文本分类常用的数据集进行了梳理总结。对未来的发展趋势进行了分析与展望。

%U http://cea.ceaj.org/CN/10.3778/j.issn.1002-8331.2101-0096