GCN-PU:基于图卷积网络的PU文本分类算法

doi:10.3778/j.issn.1002-8331.2003-0195

计算机工程与应用 ›› 2021, Vol. 57 ›› Issue (11): 162-167.DOI: 10.3778/j.issn.1002-8331.2003-0195

GCN-PU:基于图卷积网络的PU文本分类算法

姚佳奇，徐正国，燕继坤，王科人

盲信号处理重点实验室，成都 610041

出版日期:2021-06-01 发布日期:2021-05-31

GCN-PU: PU Text Classification Algorithm Based on Graph Convolutional Network

YAO Jiaqi, XU Zhengguo, YAN Jikun, WANG Keren

National Key Laboratory of Science and Technology on Blind Signal Processing, Chengdu 610041, China

Online:2021-06-01 Published:2021-05-31

摘要/Abstract

摘要：

针对PU（Positive and Unlabeled）文本分类问题，提出了一种基于图卷积网络的PU文本分类算法（GCN-PU），基本思想是给未标注样本加以不同的损失权重。将未标注样本全部视为负类样本，用以训练基于卷积神经网络的文本分类器；取卷积神经网络的倒数第二层的向量为文本的特征向量，以及对应的类别概率，作为图卷积网络的输入；利用图卷积网络得出的类别概率计算每个未标注样本的损失权重，重新训练文本分类器。不断重复上述三个步骤，直到算法参数稳定。在公开数据集20newsgroup上的实验结果表明，GCN-PU算法优于现有的方法，尤其在正类样本较少的情况下。

关键词: 卷积神经网络, 图卷积网络, 损失权重, PU文本分类

Abstract:

Towards PU（Positive and Unlabeled） text classification, a PU text classification algorithm based on graph convolution network is proposed. The basic idea is to assign different weights to unlabeled examples. Firstly, the unlabeled examples are all regarded as negative examples to train the text classifier based on convolutional neural network. Then, the vector of the penultimate layer of the convolutional neural network is taken as the feature vector of the text, and the corresponding class probability, as an input to the graph convolutional network. Finally, the loss weight of each unlabeled examples is calculated using the class probability derived from the graph convolutional network, and the text classifier is retrained. It repeats the above three steps until the algorithm parameters are stable. The experimental results on the public dataset 20newsgroup show that the proposed algorithm is superior to the existing ones, especially in the case of fewer positive samples.

Key words: convolutional neural network, graph convolutional network, loss weight, PU text classification

姚佳奇，徐正国，燕继坤，王科人. GCN-PU:基于图卷积网络的PU文本分类算法[J]. 计算机工程与应用, 2021, 57(11): 162-167.

YAO Jiaqi, XU Zhengguo, YAN Jikun, WANG Keren. GCN-PU: PU Text Classification Algorithm Based on Graph Convolutional Network[J]. Computer Engineering and Applications, 2021, 57(11): 162-167.

[1]	牟清萍，张莹，张东波，王新杰，杨知桥. 目标丢失判别机制的视觉跟踪算法及应用研究[J]. 计算机工程与应用, 2021, 57(9): 140-147.
[2]	包志强，邢瑜，吕少卿，黄琼丹. 改进YOLO V2的6D目标姿态估计算法[J]. 计算机工程与应用, 2021, 57(9): 148-153.
[3]	赵志焱，杨华，胡志伟，宇海萍. 基于TACNN的玉露香梨叶虫害识别[J]. 计算机工程与应用, 2021, 57(9): 176-181.
[4]	周伦钢，孙怡峰，王坤，吴疆，黄维贵，李炳龙. 目标多种多值属性的端端快速识别网络[J]. 计算机工程与应用, 2021, 57(9): 182-190.
[5]	张成，戴俊峰，熊闻心. 融合LeNet-5改进的扫描文档手写日期识别[J]. 计算机工程与应用, 2021, 57(9): 207-211.
[6]	麻哲旭，杨峰，乔旭. 铁路路基病害智能检测方法[J]. 计算机工程与应用, 2021, 57(9): 272-278.
[7]	冉蓉，徐兴华，邱少华，崔小鹏，欧阳斌. 基于深度卷积神经网络的裂纹检测方法综述[J]. 计算机工程与应用, 2021, 57(9): 23-35.
[8]	贾香恩，董一鸿，朱锋，钱江波. 异构图卷积网络研究进展[J]. 计算机工程与应用, 2021, 57(9): 36-49.
[9]	张越，黄友锐，刘鹏坤. 引入注意力机制的多分辨率人体姿态估计研究[J]. 计算机工程与应用, 2021, 57(8): 126-132.
[10]	李现国，冯欣欣，李建雄. 多尺度残差网络的单幅图像超分辨率重建[J]. 计算机工程与应用, 2021, 57(7): 215-221.
[11]	梁芳烜，杨锋，卢丽云，尹梦晓. 基于卷积神经网络的脑肿瘤分割方法综述[J]. 计算机工程与应用, 2021, 57(7): 34-43.
[12]	杨培伟，周余红，邢岗，田智强，许夏瑜. 卷积神经网络在生物医学图像上的应用进展[J]. 计算机工程与应用, 2021, 57(7): 44-58.
[13]	常昊，陈晓雷，张爱华，李策，林冬梅. 嵌入改进SENet的卷积神经网络连续血压预测[J]. 计算机工程与应用, 2021, 57(7): 130-135.
[14]	王翀，韩振奇，徐浩煜，祝永新，徐胜，陈夏. 基于改进显著图的高效裂纹检测算法[J]. 计算机工程与应用, 2021, 57(6): 219-224.
[15]	黄金杰，蔺江全，何勇军，何瑾洁，王雅君. 局部语义与上下文关系的中文短文本分类算法[J]. 计算机工程与应用, 2021, 57(6): 94-100.

GCN-PU:基于图卷积网络的PU文本分类算法

GCN-PU: PU Text Classification Algorithm Based on Graph Convolutional Network

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics