序列蛋白质-GDP绑定位点预测

计算机工程与应用 ›› 2016, Vol. 52 ›› Issue (13): 55-59.

序列蛋白质-GDP绑定位点预测

石大宏，何雪

南京理工大学计算机科学与工程学院，南京 210094

出版日期:2016-07-01 发布日期:2016-07-15

Sequential protein-GDP binding residues prediction

SHI Dahong, HE Xue

School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China

Online:2016-07-01 Published:2016-07-15

摘要/Abstract

摘要： 正确地识别蛋白质-二磷酸鸟苷（Guanosine Diphosphate，GDP）绑定位点对于蛋白质功能分析和药物设计有非常重要的意义。蛋白质-GDP绑定位点预测是一个典型的不平衡学习问题。直接应用传统的机器学习方法是不合适的，而且会使预测结果偏向大多数类。为了解决这个问题，在基于稀疏表示的位置特异性得分矩阵特征基础上，提出了加权下采样方法来使得样本平衡，采用支持向量机算法来预测。实验结果表明提出的方法能获得更高的预测性能。

关键词: 蛋白质-GDP绑定预测, 位置特异性得分矩阵, 稀疏表示, 加权下采样, 支持向量机

Abstract: Accurately identifying the protein-GDP binding sites is of significant importance for both protein function analysis and drug design. Protein-GDP binding residues prediction is a typical imbalanced learning problem. Directly applying the traditional machine learning approach for this task is not suitable as the learning results will be severely biased towards the majority class. To circumvent this problem, on the basis of position specific scoring matrix feature based on sparse representation, weighted under-sampling is developed to make samples balanced. Finally support vector machine is used for prediction. Experimental results show that the proposed method achieves higher prediction performances.

Key words: protein-GDP binding prediction, position specific scoring matrix, sparse representation, weighted under-sampling, support vector machine

石大宏，何雪. 序列蛋白质-GDP绑定位点预测[J]. 计算机工程与应用, 2016, 52(13): 55-59.

SHI Dahong, HE Xue. Sequential protein-GDP binding residues prediction[J]. Computer Engineering and Applications, 2016, 52(13): 55-59.

[1]	张晓闻，任勇峰. 结合稀疏表示与拓扑相似性的图像匹配算法[J]. 计算机工程与应用, 2021, 57(8): 198-203.
[2]	高一锴，彭力，徐龙壮. 改进AFSA算法优化TWSVM的火焰识别方法[J]. 计算机工程与应用, 2021, 57(8): 204-213.
[3]	韩卫宇，程龙生. 结合马田系统-SVM的滚动轴承故障模式分类研究[J]. 计算机工程与应用, 2021, 57(6): 239-246.
[4]	雷恒林，古兰拜尔·吐尔洪，买日旦·吾守尔，张东梅. 新奇检测综述[J]. 计算机工程与应用, 2021, 57(5): 47-55.
[5]	温杰彬，杨文忠，马国祥，张志豪，李海磊. 基于Apex帧光流和卷积自编码器的微表情识别[J]. 计算机工程与应用, 2021, 57(4): 127-133.
[6]	陶体伟，刘明霞，王明亮，王琳琳，杨德运，张强. 基于有效距离的低秩表示[J]. 计算机工程与应用, 2021, 57(4): 141-147.
[7]	徐先峰，蔡路路，张丽. 融合MLP和DBN的光伏发电预测算法[J]. 计算机工程与应用, 2021, 57(3): 266-272.
[8]	李俊侠，张秦，郑桂妹. 超宽带雷达人体姿态识别综述[J]. 计算机工程与应用, 2021, 57(3): 14-23.
[9]	陈富健，谢维信，夏婷. 基于LCT+的自适应抗遮挡目标跟踪算法[J]. 计算机工程与应用, 2021, 57(22): 190-198.
[10]	杨泉. N1+N2结构语法关系判定的SVM算法[J]. 计算机工程与应用, 2021, 57(20): 104-108.
[11]	高晋，赵云芃，Godfred Kim Mensah，李欣芸，刘志芬，陈俊杰，郭浩. 静息态功能脑连接的空间动态分析及分类研究[J]. 计算机工程与应用, 2021, 57(2): 150-155.
[12]	丁玉祥，卞维新，接标，赵俊. 融合邻域回归和稀疏表示的图像超分辨率重构[J]. 计算机工程与应用, 2021, 57(2): 230-236.
[13]	秦博宇，郝晓燕，刘永芳. 基于SVM和CRF双层模型的FrameNet框架消歧[J]. 计算机工程与应用, 2021, 57(18): 255-262.
[14]	徐然然，吴小俊，尹贺峰. 鉴别性非负表示分类及其在人脸识别中的应用[J]. 计算机工程与应用, 2021, 57(13): 147-153.
[15]	郑淋文，周金治，黄静. 深度稀疏自编码器在ECG特征提取中的应用[J]. 计算机工程与应用, 2021, 57(11): 156-161.