学位论文 > 优秀研究生学位论文题录展示

蛋白质的β-发夹、β(γ)-转角及四类简单超二级结构预测

作 者: 胡秀珍
导 师: 李前忠
学 校: 内蒙古大学
专 业: 理论物理
关键词: 局域结构预测 超二级结构模体 β-发夹 β-转角 γ-转角 离散增量 打分矩阵 支持向量机
分类号: Q51
类 型: 博士论文
年 份: 2007年
下 载: 159次
引 用: 0次
阅 读: 论文下载
 

内容摘要


由于蛋白质的功能与其结构是密切相关的,因此研究蛋白质的结构是获取功能信息的重要手段。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于蛋白质结构数据的增长速度。然而,通过实验手段确定蛋白质的结构,不但成本高、耗时,而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望能利用理论计算的方法直接从序列信息预测蛋白质结构,这也是生物信息学研究的重要课题。目前,直接从序列信息预测蛋白质的三级结构还很困难。由于局域结构有着较强的序列信号,且在三级结构中大量存在、频繁出现,对蛋白质的折叠、识别和稳定性起重要作用,因此,局域结构的预测可以简化结构预测问题,是蛋白质三级结构预测重要的中间步骤。本文主要研究蛋白质局域结构中超二级结构的预测,重点研究β-发夹模体的预测;研究了部分规则二级结构中β-转角和γ-转角的预测。1.提出了一种新的预测算法一基于离散增量支持向量机算法,用该算法首次对超二级结构数据库(ArchDB40)中β-发夹模体进行了预测,取得较好效果。2.利用离散增量和序列打分值构成的向量来表示序列信息,将离散增量和打分值作为向量输入支持向量机,在向量空间中寻找最优超平面,提出了一种新的组合向量预测算法。该算法首次应用于β-发夹模体的预测,对ArchDB40超二级结构数据库中β-发夹数据集和文献(Kumar and Bhasin,Nucleic Acids Research,2005,33:154-159)中已有的β-发夹数据集的预测结果显示,我们的算法可以实现比以往方法更高的预测成功率。与文献中已有数据集的预测结果相比,对独立的检验集预测精度提高4%,β-发夹的敏感性提高6%。另外,将这种算法首次用于ArchDB40数据库中的四类简单超二级结构分类,无论是对5-交叉检验的训练集,还是对独立的检验集都取得较好分类结果。3.在离散增量和序列打分值的基础上,进一步把预测的二级结构信息加入组合向量,将它们共同输入支持向量机,对普遍使用的,分别包含426个和320个蛋白质序列的两数据集中的部分规则二级结构β-转角和γ-转角进行了预测。结果指出,对β-转角的7-交叉检验预测精度达到79.8%、相关系数为0.47:对γ-转角5-交叉检验预测的相关系数达到了0.18,这些结果都是目前最好的预测结果。4.建立了一个新的包括2208个非冗余蛋白质链的数据库,蛋白质结构分辨率高于2.5(?),序列相似性小于40%。得到α-α模体6799个,α-β模体6711个,β-α模体6072个和β-β模体8163个,首次将最小离散增量算法用于蛋白质四类简单超二级结构预测,当序列模式固定长取8个氨基酸残基,对“822型”序列模式3-交叉检验的平均预测精度达到78%,Jack-knife检验的平均预测精度达到76.8%;当序列模式固定长取10个氨基酸残基,对“1041型”序列模式3-交叉检验的平均预测精度达到83%,Jack-knife检验的平均预测精度达到79.8%。5.在蛋白质简单超二级结构分类预测、β-发夹预测、β-转角预测及γ-转角的预测工作中,引入了二肽组分信息参数和亲疏水特征信息参数,改善了预测结果。

全文目录


相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 基于机器学习的入侵检测系统研究,TP393.08
  17. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  18. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  19. 基于AdaBoost算法的人脸识别研究,TP391.41
  20. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  21. 城市污水处理厂中A~2O工艺过程的建模研究,X703

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com