学位论文 > 优秀研究生学位论文题录展示

蛋白质序列相似性分析

作 者: 于祥田
导 师: 张玉森
学 校: 山东大学
专 业: 运筹学与控制论
关键词: 蛋白质序列 相似性 亲疏水性 聚类树 56维向量
分类号: O29
类 型: 硕士论文
年 份: 2011年
下 载: 53次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文研究的蛋白质是生物体中含量最高、功能最重要的生物大分子之一。近年来,随着基因组草图的绘制完成,蛋白质研究进入了一个新的高潮迭起的时代。氨基酸是蛋白质的基本结构单元,在蛋白质中出现的氨基酸共有20种,氨基酸以肽键相互连接,形成肽链。因此在生物学中,蛋白质常被解释为是由氨基酸借肽键连接起来的多肽,然后由多肽连接起来形成的物质。将20种氨基酸作为蛋白质序列的基本单元,为我们分析蛋白质序列提供了条件。在现存蛋白质序列分析方法的基础上,本文将寻找一种不同于以往的蛋白质序列分析方法。通过对不同种类的蛋白质的相似性分析,进一步阐述了蛋白质之间的相似关系,从而也多方面验证了新方法的有效及可行性。本文主要有以下几个方面的成果:一考虑氨基酸的亲疏水性,提出了新的统计量K-块(K=1,2,3)及概率统计方法,完成了序列到数值的转换,构造出全新的56维向量。二寻找一种便于计算的序列距离用于蛋白质的相似性分析,很大程度上简化了计算的复杂度,便于对未知蛋白质进行快速分析。三选取多种代表性蛋白质(9种ND5蛋白数据,13种β珠蛋白数据,43种生物的细胞色素C数据以及40种病毒蛋白数据)并用新方法进行相似性分析,与Clustal X软件和MEGA4.1软件共同构建的蛋白质聚类树及现有的结果进行比较,分析结果并讨论方法的可行性。四根据蛋白质相似性分析的结果总结出方法的适用范围及局限性。本文通过研究发现,由于膜蛋白的亲疏水性在进化过程中被保护的很好,我们基于此性质上提出的新方法在用于小批量蛋白质序列相似性分析时所得到的结果,比单纯研究蛋白质的氨基酸序列要好,同时比现有论文的蛋白质序列分析结果更接近常用的Clustal X软件和MEGA4.1软件的分析结果。而且方法的计算复杂度更低,是一种便捷有效的分析方法。而对于大批量的蛋白质序列相似性分析,此方法在精确度上有待于进一步完善。

全文目录


摘要  8-9
ABSTRACT  9-11
前言  11-12
第1章 绪论  12-17
  1.1 生物信息学  12-13
  1.2 蛋白质概况  13-17
    1.2.1 研究意义  13
    1.2.2 发展现状  13-17
第2章 蛋白质序列的向量表示  17-23
  2.1 导言  17
  2.2 基于亲疏水性质构造的向量  17-23
    2.2.1 氨基酸亲疏水性  17-18
    2.2.2 蛋白质序列的数值转换  18-20
    2.2.3 不同蛋白质序列间的相似距离  20
    2.2.4 聚类树的构建  20-23
第3章 小数量蛋白质相似性分析  23-33
  3.1 导言  23
  3.2 ND5蛋白质相似性分析  23-27
    3.2.1 ND5蛋白质简介  23
    3.2.2 数据结果和分析  23-27
  3.3 β珠蛋白相似性分析  27-33
    3.3.1 β珠蛋白简介  27
    3.3.2 数据分析和结果  27-33
第4章 大批量蛋白质相似性分析  33-43
  4.1 导言  33
  4.2 细胞色素C相似性分析  33-38
    4.2.1 细胞色素C简介  33-34
    4.2.2 数据分析和结果  34-38
  4.3 病毒蛋白质相似性分析  38-43
    4.3.1 病毒蛋白质简介  38
    4.3.2 数据分析和结果  38-43
第5章 总结与展望  43-45
  5.1 总结  43-44
  5.2 展望  44-45
参考文献  45-49
致谢  49-50
攻读学位期间发表的学术论文  50-51
学位论文评阅及答辩情况表  51

相似论文

  1. 基于行为特征的IRC僵尸网络检测方法研究,TP393.08
  2. 构式语法观照下的高中英语双及物结构教学研究,G633.41
  3. 平顶山烤烟综合质量评价及与美国烤烟的对比分析,S572
  4. 旅游对芦芽山国家级自然保护区典型植被的影响,S759.9
  5. 基于形状的汉画像检索技术研究,TP391.41
  6. 元白相似性考索,I207.22
  7. 利用非局部相似性的图像超分辨率重建研究,TP391.41
  8. 基于自相似分析的流媒体DDoS攻击检测方法研究,TP393.08
  9. 水量调度决策支持系统中的数据挖掘应用研究,TV697.11
  10. 基于PLSA语义聚类的web服务发现方法,TP393.09
  11. 基于相似性测量检测图像型垃圾邮件技术的研究,TP393.098
  12. 支持重复数据删除的网络备份系统中存储服务器的设计与实现,TP309.3
  13. 僵尸控制行为识别及检测方法研究,TP393.08
  14. 基于行为特征的僵尸网络检测方法研究,TP393.08
  15. 物联网业务应用协议的研究与实现,TN929.5
  16. 基于本体多Agent系统的交易伙伴智能发现相关技术研究,F713.36
  17. 头肩图像视频的自动分割,TP391.41
  18. 黄瓜无侧枝基因nlb的定位及矮牵牛种质资源多样性分析,S642.2
  19. 基于半监督哈希算法的图像检索方法研究,TP391.41
  20. 面向非标准化制造的工时定额研究,F425
  21. 盾构刀盘驱动系统节能技术研究,U455.39

中图分类: > 数理科学和化学 > 数学 > 应用数学
© 2012 www.xueweilunwen.com