计算机工程与应用 ›› 2022, Vol. 58 ›› Issue (2): 153-160.DOI: 10.3778/j.issn.1002-8331.2007-0407
梁鸿翔,张步烨,李炜卓,程茜雅
LIANG Hongxiang, ZHANG Buye, LI Weizhuo, CHENG Xiya
摘要: 作为“智慧法院”的核心应用之一,相似裁判文书的发现有助于解决司法过程中裁判尺度不统一、类案不同、量刑不规范等问题。目前,一部分方法侧重于从裁判文书中总结领域特征,并将这些特征融入到语言模型中来提升相似文书发现的效果。另一部分工作将其转化为分类任务,利用有监督学习模型来进行建模与预测。然而,已有的方法没有考虑将语言模型与分类模型各自的优势进行结合。为此,提出一种基于网络表示学习(network representation learning)和文本卷积网络(convolutional neural network for texts)的类案发现方法。方法分别从无监督学习与有监督学习的视角来建模裁判文书中的信息,并根据法律知识体系对原有模型的负采样方法(negative sampling)进行改进。最终,方法设计了一种较为合理的投票机制将两类模型的结果进行融合。实验结果表明,提出的联合方法较已有方法能在类案发现任务中取得更高的推送准确率。