学位论文 > 优秀研究生学位论文题录展示

比较基因组学平台的设计与构建

作 者: 刘娜
导 师: 邓亲恺
学 校: 南方医科大学
专 业: 生物医学工程
关键词: 比较基因组学 基因组可视化 同线性 基因组重组 生物信息学 结核分支杆菌
分类号: Q75
类 型: 硕士论文
年 份: 2010年
下 载: 220次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着高速测序技术的迅猛发展和众多物种的全基因组测序计划的实施,基因组数据呈海量增长趋势。大规模的全基因组数据的功能分析需要新的算法、软件和强大的计算平台的支持。本文首先针对比较基因组学研究现状,总结了比较基因组学应用软件中存在的问题,这些问题主要表现在不同软件有各自特殊的数据输入输出格式,且常常采用不同的算法,各自侧重点也不同;此外有些只能在特定的操作系统下运行,大多数软件设置的参数比较多,一般生物学家往往难于掌握,结果同样的序列用不同的软件得到的结果也不同。而特别值得指出的是,一个全基因组数据往往都非常庞大,尤其是进行多重全基因组比对时,需要耗费大量的计算时间和存储空间,个人计算机往往不能满足要求。针对上述问题开发了面向生物学家的比较基因组学分析平台,平台采用浏览器/服务器(Browser/Server, B/S)网络构架,用户可以在个人计算机上通过web浏览器,将基因组数据提交到相应的web服务器,同时选择参数,服务器进行分析和处理后,将结果返回到用户浏览器或直接发送到用户邮箱。服务器的硬件平台为一台装有Linux操作系统的高性能计算机(PowerCluster8000IN),网络服务器为Apache HTTP,平台数据管理则采用MySQL数据库,并用Perl语言做后台的开发工具,HTML编写前台网页。平台可以接受fasta、multi-fasta、genebank等格式的数据文件和用户直接提交的序列作为输入数据。最后数据分析的结果以表格、文本或图像形式返回用户平台。平台的主要功能有:(1)全基因组比较分析:寻找基因组间的同线性区域,基因组重组(基因插入/缺失、重复、重排和水平转移),单核苷酸突变和拷贝数变异。(2)基因组碱基组成成分分析,基因预测,tRNA预测,rRNA预测和重复序列搜索。(3)动态显示基因组比对的同线性和基因组重组图形和插入删除结果,用户可以对图像进行放大、缩小和平移等操作。基于所构建的平台,本文对10种新型甲型流感病毒和33个结核分支杆菌基因组及相关菌株的全基因组进行了比较基因组学研究。对新型甲型流感病毒株作全基因组同源性分析,表明PB1基因可能来自于人H3N2,PB2、PA基因可能来自于禽类H3N2,而HA、NS基因可能来自于猪H1N1。对结核分枝杆菌以及相关菌株等的全基因组序列的同线性区域、重复序列和单核苷酸多态性进行比较基因组学研究分析,发现插入/缺失和重复序列是导致结核分枝杆菌菌株基因组差异的主要来源。这些应用研究验证了平台的有效性。

全文目录


摘要  3-5
ABSTRACT  5-9
第一章 前言  9-17
  1.1 研究背景  9-11
  1.2 比较基因组学  11-14
  1.3 基因组学分析内容  14-17
    1.3.1 比较分析基因组结构  14-15
    1.3.2 比较分析编码区域  15-16
    1.3.3 比较分析基因组非编码区域  16-17
第二章 比较基因组学研究  17-26
  2.1 比较算法基础  17-20
    2.1.1 序列比对定义  17
    2.1.2 序列比对的分类  17-20
  2.2 比较基因组学工具  20-23
    2.2.1 双基因组比对(pair-wise genome alignment)  20-21
    2.2.2 多基因组比对(multiple genome alignment)  21-22
    2.2.3 基因组可视化工具  22-23
  2.3 比较基因组学网络服务资源  23-24
  2.4 比较基因组学平台设计的意义  24-26
第三章 比较基因组学平台的设计与实现  26-43
  3.1 总体设计  26-28
    3.1.1 基本构架  26-27
    3.1.2 平台运行环境与开发工具  27-28
  3.2 平台的功能设计  28-38
    3.2.1 基因组比较  30-32
    3.2.2 基因组分析  32-36
    3.2.3 基因组比较浏览器  36-38
  3.3 程序设计  38-42
    3.3.1 用户页面制作  38
    3.3.2 数据处理流程  38-42
  3.4 小结  42-43
第四章 比较基因组学平台的应用研究  43-54
  4.1 新型甲型流感病毒A/H1N1同源性分析  43-45
  4.2 结核分枝杆菌及相关菌株基因组比较  45-53
    4.2.1 基因组基本特性比较  45-46
    4.2.2 基因组同线性分析  46-50
    4.2.3 基因组间单核苷酸多态性分析(SNPS)  50
    4.2.4 重复序列分析  50-53
  4.3 小结  53-54
第五章 总结和展望  54-56
参考文献  56-60
论文附件清单  60-61
攻读硕士期间发表的论著  61-62
致谢  62-64
统计学证明  64-65

相似论文

  1. 烟草疫霉菌效应物基因比较基因组学分析,S432.1
  2. 利用DDRT-PCR技术研究AM真菌侵染紫穗槐过程中相关基因,S793.2
  3. Paenibacillus mucilaginosus KNP414全基因组测序及分析,Q78
  4. 巴氏杜氏藻psy侧翼调控序列的克隆及其环境因子调控元件分析,S917.3
  5. 基于小鼠芯片数据挖掘猪生长发育性状的候选基因集,S828
  6. ESAT-6-Ag85A融合基因DNA疫苗增强卡介苗初免的免疫原性和保护性,R392
  7. 南美白对虾养殖底泥氨氧化细菌与氨氧化古菌多态性分析,S917.1
  8. 中国部分地区广泛耐药结核菌耐基因分布特点及演变规律研究,R52
  9. 钝顶节旋藻(Arthrospira platensis AGB-AP02)全基因组测序及特性分析,Q943.2
  10. 代谢网络及路径(pathway)的研究和应用,Q493
  11. pAdtrack-cmv-rHSG重组穿梭质粒载体的构建、序列分析及rHSG生物信息分析,R346
  12. 非结核分支杆菌性角膜炎的基础与临床研究,R772.21
  13. 构建新西兰白兔脊柱结核模型的实验研究,R529.2
  14. 中华绒螯蟹促雄性腺素的分离纯化及结构预测,S917.4
  15. 基于细菌人工染色体文库的鲤鱼基因组学研究,S917.4
  16. 结核分支杆菌PE/PPE特异性基因的克隆表达及初步应用,R52
  17. 交互移位中位点问题的算法研究,TP301.6
  18. 个人基因组信息管理及可视化技术研究,TP311.13
  19. 微阵列数据处理平台的设计与实现,TP311.52
  20. 短柄草MADS-box基因家族的生物信息学分析,Q943
  21. 基于SAS系统的基因序列模型分析,Q75

中图分类: > 生物科学 > 分子生物学 > 分子遗传学
© 2012 www.xueweilunwen.com