计算机工程与应用 ›› 2019, Vol. 55 ›› Issue (23): 150-162.DOI: 10.3778/j.issn.1002-8331.1809-0147
胡健,朱海湾,毛伊敏
HU Jian, ZHU Haiwan, MAO Yimin
摘要: 关键蛋白质是生物体内一切生命活动中不可缺少的物质基础,关键蛋白质的识别不仅可以从理论上理解生命活动机理,同时在实际应用中为药物研制、疾病治疗提供重要基础。目前,现有的关键蛋白质识别算法大多应用在静态PPI网络上,忽略了蛋白质的动态性和保守性,只考虑网络拓扑结构,忽略了蛋白质的生物特性,并且未能完全解决PPI网络中假阳性和假阴性问题。针对以上问题,构建一种混合动态保守蛋白质的时序加权PPI网络,并提出一种名为JTBC(Joint Topological properties,Biological properties and Complexes information)的关键蛋白质识别算法。利用基因表达数据提取动态蛋白质和保守蛋白质的活性信息,以动态调整静态PPI网络进而构建时序PPI网络,有效降低了PPI网络中的假阴性;设计一种融合双重拓扑特性的点边凝聚度DEcc(node and edge cohesion coefficient),以衡量蛋白质在PPI网络中的拓扑特性,再结合带有生物特性的蛋白质结构域信息和皮尔逊相关系数为时序PPI网络加权,以准确描述蛋白质之间的相互作用,减少了假阳性的影响;根据关键蛋白质的聚集特性和共表达特性,设计一种共表达复合物中心性方法局部评估蛋白质的重要程度。综上考虑,整合权重信息和蛋白质复合物信息来综合衡量蛋白质的关键性。实验结果表明该算法能够从全局和局部特性较准确地识别关键蛋白质。