学位论文 > 优秀研究生学位论文题录展示
并行计算在生物信息学中的运用和实现
作 者: 蒋安纳
导 师: 童春发
学 校: 南京林业大学
专 业: 计算机应用技术
关键词: 生物信息 MPI 并行处理 phrap mpiphrap BLAST mpiblast HMMER
分类号: TP338.6
类 型: 硕士论文
年 份: 2010年
下 载: 112次
引 用: 2次
阅 读: 论文下载
内容摘要
生物信息学是多门学科相互交叉而形成的一门新兴学科,是当今生命科学和自然科学的核心领域和最具活力的前沿领域之一。使用计算机系统进行科学计算和模拟已经成为现代生物研究最重要的方法之一。在生物信息学中,DNA序列的比对、拼接和基因表达数据的聚类分析是最常见也是重要的内容,它们数据量多、计算量大,对计算机的处理速度等性能要求较高。虽然高性能并行计算机能够满足大规模计算的需要,但其价格昂贵,使用成本高。本文提出使用PC机构建局域网络,开发并使用并行化的生物信息学软件。本文提出了一种可扩展的架构模式Bio_Mpi。在深入分析现有的phrap软件的前提下,针对并行计算环境,提出一种新的并行算法并实现了基于Bio_Mpi架构下的并行拼接软件mpiphrap。本文还针对mpiblast和HMMER这2款并行化的软件,给出了并行化接口并移植于Bio_Mpi架构下。最后,分别针对基于Bio_Mpi架构下mpiphrap、mpiblast和HMMER这3款软件进行了测试,并给出了在单节点和多节点运行环境的情况下的测试结果。试验数据表明mpiphrap、mpiblast和HMMER的并行化是高效可行的。
|
全文目录
致谢 3-4 摘要 4-5 ABSTRACT 5-8 第一章 绪论 8-15 1.1 课题背景 8-9 1.2 国内外生物并行软件的研究现状 9-13 1.2.1 并行计算的研究进展 9-10 1.2.2 phrap 研究进展 10-11 1.2.3 BLAST 研究进展 11 1.2.4 HMMER 的研究进展 11-13 1.3 本课题的研究意义和主要内容 13-15 1.3.1 本课题的研究意义 13-14 1.3.2 本课题的主要研究工作 14-15 第二章 并行软件架构体系Bio_Mpi 的开发 15-26 2.1 开发语言介绍 15-18 2.1.1 MPI 简介 15 2.1.2 通信域 15-16 2.1.3 MPI 调用接口 16 2.1.4 MPI 并行编程模式 16-17 2.1.5 MPI 通信模式 17-18 2.2 模型设计 18 2.3 Bio_Mpi 架构图 18-19 2.4 Bio_Mpi 的开发 19-21 2.4.1 主节点的初始化串行处理过程 19-20 2.4.2 各节点的并行处理过程 20 2.4.3 主节点汇总处理过程 20-21 2.5 mpiphrap 的开发 21-26 2.5.1 mpiphrap 的并行思想 21-23 2.5.2 mpiphrap 的并行算法 23-26 第三章 并行软件架构体系Bio_Mpi 的测试 26-37 3.1 Bio_Mpi 的测试环境 26 3.2 mpiphrap 的测试 26-29 3.2.1 杨树的mpiphrap 测试 26-28 3.2.2 芝麻的mpiphrap 测试 28-29 3.3 mpiblast 的测试 29-33 3.3.1 测试使用的软件版本 29 3.3.2 Swiss_Prot 数据库的测试 29-32 3.3.3 env_nr 数据库的测试 32-33 3.4 HMMER 的测试 33-37 3.4.1 hmmbuild 的测试 33-34 3.4.2 hmmsearch 的测试 34-37 第四章 结束语 37-38 参考文献 38-40 附录A Fedora 操作系统中的设置 40-44 1 Fedora 的准备工作 40 2 创建NFS 服务 40 2.1 服务器的设置 40 2.2 客户机的设置 40 3 创建SSH 信任连接 40-42 4 安装MPICH2 42-43 5 环境测试 43 6 编写程序并运行 43 7 卸载环境 43-44 附录B 安装mpiblast 44-48 1 下载和解压 44 2 安装ncbi 44-46 3 安装mpiblast 46-47 4 mpiblast 环境设置 47-48 附录C 安装HMMER3 48-49 1 安装hmmer 48-49 详细摘要 49-50
|
相似论文
- BioLab面向生物计算服务的网格系统,TP399-C8
- 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
- 条纹斑竹鲨和鲫鱼BAFF基因的克隆和性质分析,S917.4
- 昆虫OBP CSP和sid-1基因的预测及序列分析,Q78
- 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
- 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
- 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
- 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
- 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
- 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
- 斯氏按蚊感染约氏疟原虫后24小时差异表达基因的筛选与分析,R531.3
- 家蚕HSP基因的表达调控研究,S881.2
- 电离辐射诱发microRNA表达改变及其对辐射损伤调控机制,R144
- 多DSP并行航迹规划系统接口驱动程序设计与实现,TP368.12
- 过载虚机条件下MPI通信性能改善方法研究,TP302
- 实时海洋浮游生物目标智能识别系统设计,TP391.41
- 自动化生产车间资源配置仿真及优化,O226
- 基于非负矩阵分解的高光谱遥感图像混合像元分解研究,TP751.1
- 上海近郊某地区犬Torque Teno virus感染率调查及全基因组序列分析,S858.292
- DTMB中3780点FFT在多核DSP平台上的实现,TP368.1
- MIMO系统中检测算法的研究,TN919.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com
|