学位论文 > 优秀研究生学位论文题录展示
基于GPU和压缩索引的新一代测序数据再测序研究
作 者: 应德全
导 师: 叶继华
学 校: 江西师范大学
专 业: 计算机科学与技术
关键词: 生物信息 新一代测序 再测序 GPU CUDA BWT
分类号: Q78
类 型: 硕士论文
年 份: 2010年
下 载: 40次
引 用: 0次
阅 读: 论文下载
内容摘要
GPU(GraphicProcessingUnit)是近几年出现的具有极高并行能力的计算部件,它和CPU可以构成多核异构架构,在很多领域有应用潜力。BWT(Burrows‐WheelerTransform)是一种无损、可逆的数据转换方式,基于BWT的压缩索引具有搜索速度快,占用内存少的优点,在海量字符串检索中具有很明显的优势。新一代测序是近几年出现并受到极大重视的一种高通量DNA/RNA检测技术,它已成为获得基因数据的主要方式,在基因型变异、基因注释、mRNA和miRNA分析、DNA甲基化研究和个体医疗等领域有广泛用途,是生物信息学的一个研究热点。相对于以往的传统测序技术,新一代测序产生的序列更短,数量更多,数据量达到数十至上百GB。这些数据往往要经过一个定位到基因组,称之为再测序的操作。这种操作需要昂贵的计算机系统或者花费较长的时间。为此,本文研究通过结合基于BWT的压缩索引和GPU,高速有效地实现再测序。本文首先分析了相关领域的现状和上述结合的可行性,随后就新一代测序的数据特点,GPU计算的编程方式和优化方式,以及基于BWT的压缩索引的原理和实现进行了阐述和研究。紧接着,本文提出了基于GPU和BWT压缩索引的新一代测序数据的再测序的实现方案,并从线程分配、内存拷贝、关键结构和动态内存分配4个方面进行了详细叙述,在叙述中还进行了多方面的测试和验证。最后,本文对所实现的GPU‐BWA算法进行了测试,并分析了测试结果。在结论中,本文还提出了GPU‐BWA算法下一步要做的工作和改进的方案。本项研究充分表明基于GPU和BWT压缩索引的再测序是可行和有效的,同时,本项研究也是拓展GPU和压缩索引应用的很好的实例。
|
全文目录
摘要 3-4 ABSTRACT 4-7 第1章 绪论 7-15 1.1 研究背景和目的 7-12 1.1.1 新一代测序技术 8-9 1.1.2 多核计算 9 1.1.3 BWT 和后缀数组 9-12 1.2 领域现状及可行性分析 12-14 1.3 本文结构 14-15 第2章 新一代测序与基因组再测序 15-24 2.1 新一代测序技术 15-17 2.2 基因组再测序 17-23 2.2.1 索引的构建 20-22 2.2.2 用索引进行再测序 22-23 2.3 本章小结 23-24 第3章 GPU 与CUDA 24-32 3.1 高度并行、多核、异构的GPU 通用计算架构 24-26 3.2 CUDA 计算平台 26-31 3.2.1 CUDA 之前的GPU 通用计算 26-27 3.2.2 CUDA 简介 27-28 3.2.3 CUDA 的线程模型 28-29 3.2.4 CUDA 的内存模型 29-30 3.2.5 CUDA 编程存在的问题 30-31 3.3 本章小结 31-32 第4章 基于GPU 的再测序分析与设计 32-44 4.1 索引构建的GPU 优化分析 32-33 4.2 利用已构建索引进行GPU 再测序的设计 33-43 4.2.1 线程分配设计 34-36 4.2.2 内存拷贝设计 36-38 4.2.3 关键结构设计 38-40 4.2.4 动态内存分配设计 40-43 4.3 本章小结 43-44 第5章 性能测试与比较 44-55 5.1 CUDA 平台性能测试 44-49 5.1.1 矩阵转置测试 44-46 5.1.2 矩阵乘法测试 46-48 5.1.3 线程分配测试 48 5.1.4 关键结构测试 48-49 5.2 再测序性能测试 49-54 5.2.1 GPU‐BWA 与BWA 的性能比较 49-51 5.2.2 参数调整对GPU‐BWA 的影响 51-54 5.3 本章小结 54-55 第6章 总结和下一步工作 55-57 参考文献 57-63 致谢 63-64 在读期间发表论文及科研情况 64
|
相似论文
- BioLab面向生物计算服务的网格系统,TP399-C8
- 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
- 基于RNA测序技术的马氏珠母贝珍珠囊转录组及数字基因表达谱分析,Q786
- 条纹斑竹鲨和鲫鱼BAFF基因的克隆和性质分析,S917.4
- 昆虫OBP CSP和sid-1基因的预测及序列分析,Q78
- 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
- 河南低致病性禽流感病毒(H9亚型)分离鉴定及生物学特性研究,S852.65
- 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
- 入侵植物薇甘菊的转录组分析及其群体遗传特征初探,S451
- 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
- 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
- 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
- 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
- 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
- 斯氏按蚊感染约氏疟原虫后24小时差异表达基因的筛选与分析,R531.3
- 家蚕HSP基因的表达调控研究,S881.2
- 电离辐射诱发microRNA表达改变及其对辐射损伤调控机制,R144
- 基于GPU的有限元方法研究,O241.82
- 基于GPGPU的快速白光干涉测量系统研究,O439
- 新一代基因测序的数据处理中的相关问题,TP391.41
- 异构(CPU-GPU)计算机系统性能评测与优化技术研究,TP306.2
中图分类: > 生物科学 > 分子生物学 > 基因工程(遗传工程)
© 2012 www.xueweilunwen.com
|