计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (19): 94-98.DOI: 10.3778/j.issn.1002-8331.1911-0033
姚佳奇,徐正国,燕继坤,熊钢,李智翔
YAO Jiaqi, XU Zhengguo, YAN Jikun, XIONG Gang, LI Zhixiang
摘要:
针对标签随着时间变化的动态多标签文本分类问题,提出了一种基于标签语义相似的动态多标签文本分类算法。该算法在训练阶段,首先按照标签固定训练得到一个基于卷积神经网络的多标签文本分类器,然后以该分类器的倒数第二层的输出为文本的特征向量。由于该特征向量是在有标签训练得到的,因而相对于基于字符串即文本内容而言,该特征向量含有标签语义信息。在测试阶段,将测试文档输入训练阶段的多标签文本分类器获取相应的特征向量,然后计算相似性,同时乘以时间衰减因子修正,使得时间越近的文本具有较高的相似性。最后,采用最近邻算法分类。实验结果表明,该算法在处理动态多标签文本分类问题上具有较优的性能。