学位论文 > 优秀研究生学位论文题录展示

改进的系统发育谱方法在蛋白质功能预测中的应用

作 者: 马雅楠
导 师: 马志强
学 校: 东北师范大学
专 业: 计算机软件与理论
关键词: 参照基因组 系统发育谱 权值 层次聚类 K均值聚类
分类号: Q51
类 型: 硕士论文
年 份: 2008年
下 载: 80次
引 用: 1次
阅 读: 论文下载
 

内容摘要


后基因组时代的到来,生物信息学的研究重心日益从基因组测序工作转移到对已测序基因组的功能进行注释。传统的基于同源性的注释方法由于自身存在的缺陷在精确度方面已经不能满足人们的需要。非同源性的功能注释方法渐渐受到人们的重视。有别于同源性方法中对基因或蛋白质间相似性的考虑,非同源性方法则是根据基因或蛋白质之间的进化上的相关性来预测它们之间的功能关联。在众多非同源性方法中,系统发育谱方法是应用得最为广泛的一种,同时也是最具研究价值的一种。系统发育谱方法最早是由Pellegrini等人于1999年提出的。该方法从刚一提出就引起人们的广泛关注。在此后的几年时间里,众多研究学者对这种方法做出了不同程度的改进。这些改进包括了系统发育谱的三个步骤,即参照基因组的选择、系统发育谱的构建以及谱的相似性分析。尽管如此,该方法到目前为止还有许多不足之处,如参照基因组的选取还没有一定的标准,对相似谱的聚类也还没有有效地利用现有的经典聚类算法。针对这些不足,对系统发育谱算法提出了两点改进:一是为构造基于权重的系统发育谱,从而间接减少了对于参照基因组选择的过分依赖;二是在对构造好的发育谱进行相似性分析时,结合使用两种应用最为广泛的经典聚类算法——层次聚类算法和K均值聚类算法。通过两种方法的取长补短来达到更好的聚类效果。

全文目录


摘要  4-5
Abstract  5-8
引言  8-9
第一章 绪论  9-13
  1.1 研究意义  9
  1.2 研究目的  9-10
  1.3 国内外研究现状  10-11
  1.4 本文的主要工作  11-12
  1.5 本文组织结构  12-13
第二章 背景知识简介  13-23
  2.1 蛋白质功能注释方法介绍  13-15
    2.1.1 同源性方法  13-14
    2.1.2 非同源性方法  14-15
  2.2 经典的聚类算法  15-22
    2.2.1 K-means 聚类算法  16-20
    2.2.2 层次聚类算法  20-22
    2.2.3 聚类算法在生物信息学中的应用  22
  2.3 本章小结  22-23
第三章 基于权值系统发育谱的构造  23-31
  3.1 系统发育谱方法简介  23-24
  3.2 参照基因组的选择  24-28
    3.2.1 基于树的参照基因组选择方法  26-27
    3.2.2 基于遗传距离的参照基因组选择方法  27
    3.2.3 系统发育谱的构造  27-28
  3.3 基于权重的系统发育谱的构造  28-30
  3.4 小结  30-31
第四章 基于聚类算法的谱的相似性分析  31-36
  4.1 谱的相似性分析  31-33
    4.1.1 基于距离函数的谱的相似性分析  31
    4.1.2 基于相关系数的谱的相似性分析  31-32
    4.1.3 基于相互信息量的谱的相似性分析  32-33
    4.1.4 存在的问题  33
  4.2 基于聚类的系统发育谱的相似性分析  33-35
  4.3 小结  35-36
第五章 改进的系统发育谱方法对蛋白质的功能注释  36-44
  5.1 算法描述  36
  5.2 实验数据  36-37
  5.3 实验分析  37-43
    5.3.1 实验过程  38-42
    5.3.2 性能评价  42-43
  5.4 小结  43-44
结束语  44-45
参考文献  45-48
致谢  48-49
发表论文和参与科研情况  49

相似论文

  1. 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
  2. 基于变异粒子群的聚类算法研究,TP18
  3. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  4. 基于样图的纹理合成算法研究,TP391.41
  5. 对于系统发育谱法聚类算法的改进,TP311.13
  6. WDM全光网络中路由和波长分配问题研究,TN929.1
  7. 面向消费者感性需求的手持GPS设计探讨,TN967.1
  8. 自动生成SQL测试用例集的研究与实现,TP311.52
  9. 无线传感器网络分簇覆盖算法研究,TP212.9
  10. 基于Web的社会网络搜索中人名同一性判断方法研究,TP393.09
  11. 基于DCT域高压缩图像去块效应算法研究,TP391.41
  12. 基于模糊C均值聚类的彩色图像分割算法研究,TP391.41
  13. 多点监测自适应网内数据融合技术的研究及应用,TP202
  14. 遥感图像的K-均值聚类和分水岭分割算法的研究与实现,TP751
  15. 能量均衡的无线传感器网络路由算法,TP212.9
  16. 决策树分类算法的改进及其应用研究,TP311.13
  17. 基于日负荷曲线的用电行业构成比例在线修正方法研究,TM714
  18. 基于两层次聚类的车辆配载调度方法,U492.22
  19. 面向装备研制的产品平台构建研究,TJ08
  20. 基于遥感影像的道路提取算法研究,TP751
  21. 旋转式空调压缩机匹配易用性的设计研究,TB652

中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com