计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (17): 275-285.DOI: 10.3778/j.issn.1002-8331.2211-0262
梁龙跃,王浩竹
LIANG Longyue, WANG Haozhu
摘要: 信用风险的评估与管理是金融机构的重要任务之一。为探究个人征信样本与违约样本间存在相似性时,能否体现个人征信的信用风险,并对预测其违约做出贡献。基于LendingClub 2020年第1~3季度贷款数据,利用GAMI-net从高维征信数据中筛选样本违约特征,并通过曼哈顿距离构建样本相似性网络,以反映样本整体间的征信相似性,并建立基于图卷积神经网络的信用风险预测模型。研究发现,个人征信相似性能体现信用风险,并对预测产生显著正面贡献。基于图卷积神经网络的风险预测模型在实验中的AUC值为81.60%,准确率为73.71%,相较于所有基准对比模型均大幅提升,表明考虑了样本相似性网络的图神经网络模型在信用风险预测精度上远优于未考虑样本相似性的机器学习模型。此外,所提供的特征筛选及样本间网络构建方法也为大数据智能风控提供了一定的借鉴意义。