计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (10): 86-93.DOI: 10.3778/j.issn.1002-8331.2208-0350
蒋晔路,权丽君,吴庭芳,吕强
JIANG Yelu, QUAN Lijun, WU Tingfang, LYU Qiang
摘要: 以分子毒性为代表的分子属性预测在以药物设计为主的多个领域的发展中发挥着重要作用,但直接利用分子结构信息快速且准确地预测分子毒性一直是一个挑战。目前,卷积网络和图网络等深度学习方法的出现在这个问题的解决上得到了一定的进展。而以图网络为主的深度学习方法在分子毒性预测中存在两个关键问题,影响预测性能:第一,数据驱动使得模型在面对小批量数据时依然没有可靠的性能。第二,建模分子结构只考虑了天然共价键,只能提供粗粒度的信息。为解决上述问题,给出了一种对分子结构的新型建模方式MT-ToxGNN。该方法将多任务的思想融入图神经网络中,使得不同任务在训练时可以互相学习不同数据的可靠分布,从而避免在小批量数据上的过拟合问题。将分子编码成拓扑图结构时同时考虑分子内共价键以及非共价作用,就是在使用分子共价键构建传统图的边集之后,再使用非共价作用构建新型图的边集,从而弥补传统图网络对分子结构信息表示的不足。使用特别设计的图网络分别处理分子的共价与非共价信息,充分学习不同的分子结构。在与大量先进方法的性能比较中,MT-ToxGNN在多个分子毒性数据集上皮尔森系数指标达到了最佳。