学位论文 > 优秀研究生学位论文题录展示
NJ进化树构建方法的改进及其应用
作 者: 高凯
导 师: 李玉鑑
学 校: 北京工业大学
专 业: 计算机应用技术
关键词: 进化树 二叉树 多叉树 邻接法 距离矩阵
分类号: TP301.6
类 型: 硕士论文
年 份: 2008年
下 载: 494次
引 用: 3次
阅 读: 论文下载
内容摘要
分子系统发育分析是生物信息学中的重要研究领域,它的主要研究手段是从一组同源的DNA或蛋白质序列出发,计算各个序列之间的进化距离,从而得到反映物种进化关系的进化树。进化树通常是一棵二叉树:树的叶节点,代表了某个具体序列;树的拓扑结构表现了各物种之间的亲缘关系远近;树的分枝长度刻画了进化距离的大小。构建进化树的方法主要分为三类,即距离矩阵法、最简约方法和极大似然法。虽然距离矩阵法以结构简单、具有良好的理论基础等特点获得了广泛的应用,但是这种方法在某些情况下会产生两个或多个拓扑结构不同的“等价”进化树,也就是文献上所说的“tied trees”。邻接法(Neighbor-Joining,以下简称NJ)是一种比较常见的距离矩阵法,也存在“tied trees”问题,尽管其设计目标是对同样的序列数据产生与输入顺序无关的唯一进化树。对于NJ法的“tied trees”问题,大多数流行的分子系统发育分析软件并没有进行有效的处理,通常仅根据算法实现方式的不同,只给出其中一种进化树的拓扑结构。本文详细分析了NJ法产生“tied trees”问题的原因,提出并实现了一种改进邻接法(Improved Neighbor-Joining algorithm,以下简称INJ)。INJ是NJ的一种扩展,而NJ可以看作INJ的一个特例。在迭代计算过程中,NJ总是任意选取两个具有最小速率校正距离的序列或种群进行合并来生成新的分类单元,而INJ则允许把多个(目前限制为3个)具有相同最小速率校正距离的序列或种群进行合并,因此它所产生的进化树可能是多叉树。在NJ树不唯一时下,INJ树通常是一棵唯一的多叉树;而在NJ树唯一时下,INJ树则与NJ树完全一致。因此,INJ法较好地解决了NJ法的“tied trees”问题。此外,本文还实现了一个包含完整INJ法和传统NJ法的分子发育分析软件——Multi-Tree。该软件是一个基于Microsoft .Net framework 2.0平台构建的客户端应用,其中包括:多序列比对和编辑、距离矩阵计算、多种进化树构建方法和显示模式。Multi-Tree软件系统采用了基于插件的程序结构,从指定位置的一组程序集中动态获取系统的界面元素与业务逻辑,具有良好的扩展性与可维护性,还可支持多语言的界面显示。
|
全文目录
摘要 3-4 Abstract 4-7 第1章 绪论 7-15 1.1 课题背景 7-8 1.2 国内外研究概况 8-13 1.2.1 基于距离的建树方法 9-10 1.2.2 最大简约方法 10-11 1.2.3 极大似然法 11-12 1.2.4 建树方法的特点与比较 12-13 1.3 本文的主要研究工作 13-14 1.4 文章结构 14-15 第2章 NJ 法介绍 15-29 2.1 距离矩阵法构建进化树的基本过程 15-18 2.1.1 构建进化树 15-17 2.1.2 核苷酸替代模型 17-18 2.2 NJ 算法 18-24 2.3 NJ 法结果不唯一问题的分析 24-28 2.4 传统建树方法的其他问题 28 2.5 本章小结 28-29 第3章 NJ 进化树构建方法的改进 29-45 3.1 INJ 的基本思想 29 3.2 INJ 算法描述 29-38 3.3 实验数据与结果分析 38-44 3.3.1 9 个熊细胞色素数据的实验 38-44 3.4 算法分析 44 3.5 本章小结 44-45 第4章 Multi-Tree 分子进化分析系统的设计与实现 45-64 4.1 系统设计原则 45 4.2 系统需求 45-47 4.2.1 业务目标 46-47 4.2.2 用户特点 47 4.3 系统架构与实现细节 47-48 4.4 业务逻辑对象说明 48-51 4.5 系统输入输出 51-55 4.5.1 进化树结果 51 4.5.2 项目文件 51 4.5.3 序列文件 51-52 4.5.4 多序列比对结果 52 4.5.5 距离矩阵文件 52-53 4.5.6 进化树的字符串表示 53 4.5.7 系统树的绘制风格 53-55 4.6 系统运行环境 55-56 4.7 系统打包发布 56-60 4.8 系统的安装 60-63 4.8.1 Microsoft(R) .NET Framework2.0 的安装过程 61-62 4.8.2 Multi-Tree 分子进化分析系统的安装 62-63 4.9 本章小结 63-64 结论 64-66 参考文献 66-69 攻读硕士学位期间发表的学术论文 69-70 致谢 70
|
相似论文
- 鸡传染性支气管炎病毒河南地方株分离鉴定及HN104株与HN091株全基因组序列测定,S852.65
- 企业资产证券化融资研究,F832.51
- 新疆加工番茄抗黄瓜花叶病毒转基因技术的研究,Q943.2
- 基于实物期权理论的中国卷烟销售终端体系投资决策研究,F274;F426.8
- 多光谱图像混合像元分类技术研究,TP751
- 基于滑窗小波二叉树的网络异常检测与分析,TP393.08
- 基于ECC的高效可分电子现金协议研究,TP393.09
- 战术信息传输系统的研究,TN919.2
- 基于实物期权的房地产延迟开发决策研究,F293.3;F832.5
- 基于实物期权理论的电信运营企业顾客资产测量研究,F626;F224
- 二代数与结合代数,O153
- 电力网络拓扑分析在图元编辑软件中的应用及配电网络重构方法的研究,TM711
- CTCS-3级列控系统现场测试及辅助工具的研究,U284.48
- 杨树与玉米细胞周期蛋白基因家族全基因组研究,S513
- 信用违约互换产品的定价研究,F830.9
- 基于实物期权理论的风险投资决策研究,F830.59
- 股票挂钩型结构性理财产品定价研究,F224
- 牛病毒性腹泻病毒非结构蛋白NS3 B细胞线性表位的鉴定,S852.65
- DNA序列选择进化距离及其在系统发育分析中的应用,Q523
- 可转债定价理论及其数值计算方法研究,F224
- 基于二叉树的PPP项目交换期权评价与应用研究,F283;F830.9
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com
|