计算机工程与应用 ›› 2023, Vol. 59 ›› Issue (13): 120-128.DOI: 10.3778/j.issn.1002-8331.2203-0288
汤丽华,卢宁,兰闯闯,陈荣华,吴建盛
TANG Lihua, LU Ning, LAN Chuangchuang, CHEN Ronghua, WU Jiansheng
摘要: G蛋白偶联受体(GPCRs)是最重要的药物靶标之一,约占市场上药物靶标的34%。药物发现过程中,配体生物活性的准确建模和解释对于筛选苗头化合物至关重要。研究表明,同源的G蛋白偶联受体能提升配体分子生物活性的预测性能和可解释性。提出了一种新的方法GLEM,用多任务下的深度迁移学习来预测配体的生物活性,并通过组稀疏来识别相关的关键子结构。GLEM方法在9组30个具有代表性的人类GPCR数据集上进行了实验,这些GPCRs涵盖了大部分人类GPCRs的子家族,每个GPCR数据集都包含60~3?000个配体。实验结果表明,GLEM方法在绝大多数数据集中都获得了最好的性能。与单任务学习方法相比,GLEM方法在[r2]上平均提升了31.72%;与深度学习方法相比,GLEM方法在[r2]上平均提升了22.45%。此外,还评估了不同数量的训练样本对模型性能的影响,实验发现GLEM方法在小样本情况下表现最好。