学位论文 > 优秀研究生学位论文题录展示

蛋白质序列新的表示方法

作 者: 钱盼盼
导 师: 张玉森
学 校: 山东大学
专 业: 运筹学与控制论
关键词: 生物信息学 基因组学 蛋白质序列 蛋白质结构 蛋白质功能
分类号: Q51
类 型: 硕士论文
年 份: 2011年
下 载: 26次
引 用: 0次
阅 读: 论文下载
 

内容摘要


虽然目前生物信息学研究的核心内容是基因组学,但对蛋白质组学的研究也是生物信息学所从事的一项非常重要的工作。一方面,基因作为重要的生命信息,它需要通过表达将信息转移到蛋白质上,蛋白质才是生命活动的主要承担者;另一方面,基因组学虽然在基因活性和疾病的相关性方面为人类提供了有力的根据,但实际上大部分疾病并不是由基因改变所引发的,而蛋白质组的研究不仅能为科学家们发现生命活动的规律提供物质基础,也能为他们发现众多疾病的发病机理以及攻克这些疾病提供理论根据和解决途径。所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,而对蛋白质组的研究是其中一个非常重要的内容。尽管人类基因组计划已勾画出了人体的蓝图,然而,要想全面了解复杂的人体,还需要进一步深入认识基因组所产生的全部蛋白质。蛋白质组学在生物信息学研究中的最主要任务是分析和预测蛋白质的结构,并将结构知识应用于生物学、医学、药学等生命科学领域。蛋白质的序列与蛋白质的结构之间存在着一种对应关系,这是目前进行蛋白质结构预测的一种前提性假设。基于这一前提,研究人员将通过分析比较蛋白质序列,计算序列之间的“进化距离”,从而判别蛋白质序列间的远近关系,最终找到同源蛋白质。又由于同源的蛋白质具有相似的空间结构,因此我们可以利用已知蛋白质的空间结构来推测未知蛋白质的空间结构。然而蛋白质序列的比较比DNA序列的比较更加复杂。其中一个原因是,DNA序列仅由4种碱基组成,而蛋白质序列则由20种氨基酸组成;另外,蛋白质序列不仅组成元素多,而且组成元素之间的关系比较复杂。因此,对蛋白质序列相似性关系的评价将会更加困难,而解决这一问题的关键是找到一种有效的方法来表示蛋白质序列,建立关于蛋白质序列的数学模型,用数学的方法来解决生物问题。本文的内容可以分为两个部分:在第一部分我们将提出一种新的表示蛋白质序列的方法并且验证这种方法的有效性;在第二部分我们把这种表示方法应用到对禽流感序列的分析以及对凋亡蛋白亚细胞位置的预测这两大研究课题中,并且分别将得到的结果与用以往的分析方法得到的结果进行对比,从而得出本论文中提出的蛋白质序列新的表示方法是一种非常有效的方法这一结论。我们将用四章的篇幅阐述文章的内容。本论文的主要研究工作及创新点如下:在第一章中我们简单介绍了生物信息学的概况及发展前景,并且说明了分析蛋白质序列作为这一学科的研究内容之一的研究意义。在第二章中我们首先给出了一种新的方法来表示蛋白质序列,其次对于这种新的表示方法我们做了两组实验来验证这种方法的有效性,并且得到了非常理想的结果。在第三章中,作为应用,我们首先用上述蛋白质序列的表示方法对123种H5N1的蛋白质序列进行相似性分析并且将得到的结果与用以前的分析方法得到的结果进行比较,得出了与之前的研究相似的结论。接下来我们又用蛋白质序列新的表示方法来预测凋亡蛋白的亚细胞位置,也得到了不错的预测结果。这充分体现了新方法的应用价值。在第四章中,我们提出了本论文的不足之处并且给出了总结和展望。

全文目录


目录  4-6
CONTENTS  6-8
表格目录  8-9
插图目录  9-10
中文摘要  10-12
Abstract  12-15
第一章 绪论  15-18
  1.1 生物信息学的概貌  15-17
    1.1.1 什么是生物信息学  15-16
    1.1.2 生物信息学的研究内容  16
    1.1.3 生物信息学的基本研究方法  16-17
  1.2 "分析蛋白质序列"的生物学意义  17-18
第二章 蛋白质序列新的表示方法  18-30
  2.1 蛋白质组学导论  18-19
  2.2 蛋白质序列的表示方法  19-22
    2.2.1 先前的研究概况  19-20
    2.2.2 构造特征向量  20-22
    2.2.3 不同蛋白质序列间的欧氏距离矩阵  22
  2.3 对取自13个不同物种的β-珠蛋白序列的相似性分析  22-25
    2.3.1 数据集  22-23
    2.3.2 对13个β-珠蛋白序列的相似性分析  23-25
  2.4 对26个冠状病毒刺突蛋白质序列的相似性分析  25-30
    2.4.1 数据集  25-27
    2.4.2 对26个冠状病毒刺突蛋白质序列的相似性分析  27-30
第三章 蛋白质序列新的表示方法的应用  30-49
  3.1 对禽流感病毒的相似性分析  30-42
    3.1.1 禽流感病毒的背景知识简介  30-31
    3.1.2 数据集  31-32
    3.1.3 不同的H5N1病毒的蛋白质序列间的欧氏距离矩阵  32-33
    3.1.4 对H5N1病毒的蛋白质序列的相似性分析  33-42
  3.2 对凋亡蛋白亚细胞位置的预测  42-49
    3.2.1 前言  42-43
    3.2.2 数据集  43-44
    3.2.3 分类算法  44-45
    3.2.4 评估预测结果  45-46
    3.2.5 分析预测结果  46-49
第四章 总结与展望  49-51
  4.1 总结  49-50
  4.2 展望  50-51
参考文献  51-55
致谢  55-56
攻读硕士研究生期间发表完成的论文  56-57
学位论文评阅及答辩情况表  57

相似论文

  1. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  2. BioLab面向生物计算服务的网格系统,TP399-C8
  3. 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
  4. 罗非鱼分离蛋白的制备及其性质研究,TS254.4
  5. 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
  6. 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
  7. 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
  8. 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
  9. 南瓜籽蛋白制备及其活性多肽的研究,TS201.21
  10. 家蚕HSP基因的表达调控研究,S881.2
  11. 上海近郊某地区犬Torque Teno virus感染率调查及全基因组序列分析,S858.292
  12. 基于OpenMP的遗传退火算法的并行化,TP301.6
  13. 钝顶节旋藻(Arthrospira platensis AGB-AP02)全基因组测序及特性分析,Q943.2
  14. 生物信息学在G蛋白偶联受体功能研究中的运用,Q51
  15. 人蛋白激酶组—小分子相互作用预测,Q55
  16. 蛋白纳米脂质体制备过程中的活性保护研究,TQ464.7
  17. 桉树木质素合成途径两个关键基因的克隆与功能研究,S792.39
  18. RNA二级结构和蛋白质序列的数学表示及其应用,Q51
  19. 面向生物信息学结构预测领域的算法加速器设计,Q811.4
  20. 内毒素休克小鼠肝脏血管特异性结合肽的体内筛选及鉴定,R459.7
  21. 内毒素休克小鼠肝脏线粒体差异蛋白质组的鉴定,R459.7

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com