学位论文 > 优秀研究生学位论文题录展示

人类基因启动子序列模式组织特异性显著性检验及功能分析

作 者: 许华琳
导 师: 宫秀军
学 校: 天津大学
专 业: 计算机科学与技术
关键词: 组织特异性基因 组织特异性模式 启动子区域 模式发现 模式验证 模式功能分析
分类号: Q75
类 型: 硕士论文
年 份: 2012年
下 载: 0次
引 用: 0次
阅 读: 论文下载
 

内容摘要


辨识和分析基因组非编码区域组织特异性序列模式(motif)对理解生物体的内在活动机制、具有针对性的疾病诊断和药物设计具有重要作用。发现和分析这些序列模式需要可靠的模式发现算法、稳健的模式验证理论和系统的生物功能分析工具。本文以人类组织特异性基因启动子序列为研究对象,构建了集成多种算法的模式发现框架,设计了基于三种统计假设检验的显著性模式评分体系,并对评分较高的模式进行了功能验证。本文的主要贡献包括:首先,针对当前模式发现算法大部分不能有效利用已知的先验知识,从而导致模式的过分估计或者低估计,本文提出一种集成现有模式发现方法的元搜索架构,有效整合现有算法的结果。根据平均优于单一的原则,提出的融合算法框架能够融合各种算法的优点,使结果最优化。我们在人类83个组织3954个基因中发现了3240个模式。其次,为检验发现的序列模式在组织中的统计显著性,本文使用两种模式匹配度评分机制和三种统计假设检验方法,分别对这些模式的统计显著性进行评价,同时,设计了融合上述6种组合评价结果的基于核滤波技术的评分机制,对发现的序列模式进行统一评分。基于这种评分方法,本文首次定义了组织显著性模式(Tissue Rich Motif:TRM)和组织平凡模式(Tissue Even Motif: TEM)。我们在人类83个组织3954个基因中发现了673个TRM和917个TEM。最后,为映射发现模式的生物功能,找出其调控生物基因功能的证据,本文设计了一套分析motif功能并将其功能与其来源组织功能映射的流程框架,用来分析并解释实验结果中得到的组织特异性motif的生物功能,给实验结果提供更加可靠的证据。在实验中,大部分motif找到了与组织的功能映射。并且部分组织的功能和其motif功能映射效果很好,如Fetallung,16个特异性的Motif中有14个功能匹配成功,其中有6个motif与组织的功能全都匹配。

全文目录


摘要  3-4
ABSTRACT  4-8
第一章 绪论  8-15
  1.1 研究背景和意义  8-10
    1.1.1 提出问题  8
    1.1.2 研究目的  8-9
    1.1.3 研究意义  9-10
  1.2 研究现状  10-13
    1.2.1 Motif 发现算法  10-11
    1.2.2 Motif 验证过程  11-12
    1.2.3 Motif 与组织功能映射  12-13
  1.3 论文的主要研究内容和工作  13
  1.4 论文的结构和安排  13-15
第二章 模式发现和验证方法技术概述  15-25
  2.1 人类组织特异性基因启动子序列的数据提取  15-16
  2.2 组织特异性模式的发现算法  16-19
    2.2.1 Motif 模型表示  16-17
    2.2.2 Motif 发现算法  17-18
    2.2.3 Motif 融合  18-19
  2.3 Motif 在单个组织中的评分排序过程  19-23
    2.3.1 贝叶斯假设检验  19-20
    2.3.2 传统假设检验  20-22
    2.3.3 二项分布假设检验  22
    2.3.4 核平滑子(Kernel Smooth)  22-23
  2.4 组织特异性模式的验证和功能分析  23-25
    2.4.1 STAMP  23
    2.4.2 JASPAR 数据库  23-24
    2.4.3 GOMO 和 ProfCom 工具  24-25
第三章 组织特异性模式发现算法的融合框架  25-34
  3.1 组织特异性模式发现算法的融合框架  25-26
  3.2 模式发现算法融合框架过程  26-28
    3.2.1 数据准备  26
    3.2.2 Motif 发现  26-27
    3.2.3 Motif 融合  27-28
  3.3 Motif 发现算法融合框架的数据和结果  28-33
  3.4 小结  33-34
第四章 组织特异性模式的组织特异性检验算法  34-44
  4.1 Motif 的组织特意性验证算法  34-35
  4.2 motif 的组织特异性检验过程  35-40
    4.2.1 motif 的三种假设检验评分过程  36-38
    4.2.2 核平滑子技术(Kernel smoother)  38-40
    4.2.3 Motif 在组织中的显著性表达判断过程  40
  4.3 实验数据及结果  40-43
    4.3.1 Motif 的组织评分过程  40-41
    4.3.2 判断 motif 在组织中是否显著表达  41-42
    4.3.3 Motif 与 JASPAR 数据库对比结果  42-43
  4.4 小结  43-44
第五章 组织特异性模式的功能分析系统  44-52
  5.1 组织特异性模式的功能分析系统  44-45
    5.1.1 组织功能采集及实验结果  45
  5.2 Motif 功能采集及实验结果  45-47
  5.3 Motif 与组织功能映射过程及实验结果  47-50
  5.4 小结  50-52
第六章 结论与展望  52-54
  6.1 全文总结  52-53
  6.2 工作展望  53-54
参考文献  54-56
发表论文和参加科研情况说明  56-57
致谢  57

相似论文

  1. 脑瘤的基因网络建模与分析,R739.4
  2. 一种数据库模式匹配验证方法研究,TP311.13
  3. 从BPEL到Petri网映射的研究,TP311.52
  4. 基于MapReduce的中医药并行数据挖掘服务,TP311.13
  5. 实时数据流动态模式发现与跟踪方法,TP311.13
  6. 家蚕基因启动子活性分析和马氏管内生免疫初步研究,Q75
  7. 高效的motif识别方法研究,TP391.41
  8. 特征裁剪技术研究及其在电力系统数据驱动的暂态稳定评估中的应用,TM712
  9. 生产车间内纳米二氧化钛粉尘扩散的数值模拟研究,X513
  10. 服役水工结构可靠性评估及维修加固决策研究,TV698.2
  11. 基于显现模式分类能力的限制性贝叶斯网络分类算法,TP183
  12. 面向相似性的时间序列表示与搜索方法研究,TP311.13
  13. 水电工程运行对径流序列影响的研究,TV121
  14. 典型易燃易爆场所防火防爆技术及安全评价方法和应用,X932
  15. 基于数据挖掘的客户流失预测研究,TP311.13
  16. 基于XML的分布式试题库系统的研究与实现,TP311.13
  17. 基于概念格的Web日志挖掘的研究,TP311.13
  18. 基于HMM的函数调用序列模式发现与识别研究,TP311.52
  19. 市区开阔型街道机动车污染物扩散模式研究,X734.2
  20. 语义Web使用挖掘若干关键技术研究,TP311.13
  21. 5-羟色胺转运体敲出小鼠下丘脑垂体肾上腺皮质轴特征性改变的研究,R749.4

中图分类: > 生物科学 > 分子生物学 > 分子遗传学
© 2012 www.xueweilunwen.com