学位论文 > 优秀研究生学位论文题录展示

基因网络分析的统计模型研究

作 者: 张相华
导 师: 冯焕清
学 校: 中国科学技术大学
专 业: 生物医学工程
关键词: 系统生物学 基因共表达网络 基因调控网络 基因关联网络 网络差异分析 贝叶斯层次模型 高斯图模型 基因模块
分类号: Q75
类 型: 博士论文
年 份: 2011年
下 载: 224次
引 用: 0次
阅 读: 论文下载
 

内容摘要


细胞的生物功能是通过基因及其产物之间相互作用,形成复杂的调控网络来实现的。理解生命系统中基因间的相互作用及其功能是系统生物学研究的核心内容。通过高通量生物技术,我们获取了大规模的组学数据,如基因表达数据、蛋白质—DNA结合数据、蛋白质相互作用数据以及基因型数据等。这些数据在不同方面提供了系统认识基因的复杂调控机制所需要的信息。尽管许多计算和统计方法已经利用这些数据来分析调控网络,以系统的了解生命活动在分子水平上的机制,但是由于转录调控机制的复杂性以及高通量数据内在的噪声,完全的理解基因调控网络仍然是一个尚待解决的问题。本文以系统生物学中的一些实际问题为出发点,以基因表达数据为基础,建立统计模型,对基因网络的相关问题,如基因共表达网络的模块分析、基因调控网络的构建以及基因网络间的差异分析进行了深入的研究。本文的主要研究内容和创新点如下:1.采用基因权重共表达网络对基因模块的生物学意义及产生机制进行分析。鉴于基因调控网络的复杂性,基因模块被用来简化对基因调控网络的描述。虽然已经对基因模块进行了大量的研究,但是基因模块的定义并不统一,而且对其生物学意义及产生机制缺乏必要的了解。本文采用基因共表达网络对基因模块进行分析,以了解基因模块的生物学意义及其形成的遗传学基础。GO功能信息、KEGG生物通路及转录因子目标基因的富集分析表明,基因模块具有明显的生物学属性,而在共表达网络中采用拓扑重合度量能比皮尔逊相关度量更有效的提取出基因模块。利用同种生物的不同条件下的基因表达数据集,得到的基因模块具有很高的一致性,表明基因网络的模块化是生命活动的固有属性。结合基因型数据与基因表达数据进行的表达数量性状座位分析显示,存在着调控模块中的基因共同表达的基因组区域,部分解释了基因模块产生的遗传学机制。基因模块为分析基因表达数据和增强对基因调控网络的了解提供了简单而有效的方法。2.提出一种新的统计整合模型,能够有效的利用多种类型的干扰型基因表达数据来构建调控网络。基因调控网络在生命活动中发挥着重要的作用,调控网络的研究对认识细胞分化、新陈代谢、信号转导以及疾病产生的机制有着重要意义。随着全基因组表达数据的快速积累,已有很多方法被用来重构基因调控网络。由于涉及到许多基因间的复杂的相互作用,这些方法的精度相对较低,所以重构基因调控网络仍然是具有挑战性的课题。重构基因调控网络时,整合不同类型的基因表达数据,是提高预测精度的一个可能途径。本文提出一种新的统计整合模型,能够有效的利用多种类型的干扰型基因表达数据来构建调控网络。模型的核心思想是针对不同类型基因表达数据的特点分别建模,而后采用Fisher方法将各类型数据中得到的信息进行统计整合。仿真实验的测试结果表明,基因敲除数据是构建调控网络的最有效的信息来源,整合多种类型表达数据进行预测要优于使用单一类型的表达数据。将方法应用到DREAM4 in silico基因网络重构挑战赛,结果表明该模型具有较好的预测性能,在子挑战1中获得第2名。3.构建了基因网络差异分析的贝叶斯层次模型,它能较好的检测出网络的拓扑变化,精度高于其它模型。微阵列基因表达数据的研究重心已经由差异表达基因的检测逐渐转移到基因网络的差异分析。基因调控网络具有动态性和条件特异性,在不同的时间空间条件下,基因的调控模式发生变化,并体现在调控网络的拓扑结构的改变上。检测特异性的基因关联,可以发现在不同条件下基因关联网络的差异,能够促进对细胞发育、疾病病理的了解,并有助于确定药物的靶点基因。针对单一条件下表达数据样本量不足,会导致检测精度不高的问题,本文将不同条件下的、性质各异的表达数据汇集在一起,在贝叶斯框架内建模,使不同条件下的数据能够互相分享信息,以提高检测具有条件特异性的基因关联的精度;模型使用了spike and slab先验分布来模拟基因关联网络的稀疏性,并对基因关联的特异性程度给出了后验概率度量。各种场景下的仿真实验中,该模型均能较好的检测出仿真网络的拓扑变化,其精度高于其它模型。将该模型应用到HapMap基因表达数据中,寻找不同人种间的关联网络的差异,得到了具有生物学意义的结果。本文的研究工作得到了国家留学基金委“国家建设高水平大学公派研究生项目”(CSC:2008634012)和NIH grant GM59507的资助。

全文目录


摘要  4-6
ABSTRACT  6-14
第一章 绪论  14-26
  1.1 系统生物学概述  14-23
    1.1.1 系统生物学的定义  15-18
    1.1.2 系统生物学的网络研究  18-23
  1.2 本文的研究内容  23-26
    1.2.1 研究意义  23-24
    1.2.2 内容安排  24-26
第二章 基因共表达网络的模块分析  26-46
  2.1 研究背景  26-28
  2.2 基因权重共表达网络分析  28-33
    2.2.1 共表达相似性度量  29-30
    2.2.2 邻接函数  30-31
    2.2.3 邻接函数的参数选择  31
    2.2.4 节点间差异度量  31-32
    2.2.5 基因模块提取  32-33
  2.3 数据和分析方法  33-35
    2.3.1 数据集  33-34
    2.3.2 富集分析  34-35
    2.3.3 eQTL 分析  35
  2.4 结果与讨论  35-44
    2.4.1 网络构建及模块提取  35-36
    2.4.2 模块的富集分析  36-38
    2.4.3 拓扑重合与皮尔逊相关的比较  38-39
    2.4.4 模块的一致性分析  39-40
    2.4.5 模块的遗传学分析  40-44
  2.5 结论  44-46
第三章 多类型基因表达数据的基因调控网络重构  46-66
  3.1 研究背景  46-52
  3.2 统计整合模型  52-59
    3.2.1 基因表达数据类型  52-54
    3.2.2 误差模型  54-57
    3.2.3 关联网络  57-58
    3.2.4 微分方程模型  58
    3.2.5 统计整合  58-59
  3.3 数据与评价标准  59-61
    3.3.1 仿真数据  59-60
    3.3.2 DRREM4 数据  60
    3.3.3 评价准则  60-61
  3.4 结果与讨论  61-64
    3.4.1 仿真数据  61-63
    3.4.2 DREAM3 数据  63
    3.4.3 DREAM4 数据  63-64
  3.5 结论  64-66
第四章 基因网络差异分析的贝叶斯层次模型  66-88
  4.1 研究背景  66-68
  4.2 贝叶斯层次模型  68-76
    4.2.1 高斯图模型  68-70
    4.2.2 贝叶斯层次模型  70-73
    4.2.3 后验仿真  73-75
    4.2.4 后验推断  75-76
  4.3 仿真实验  76-82
    4.3.1 仿真数据  76-77
    4.3.2 比较方法  77-78
    4.3.3 评价准则  78-79
    4.3.4 仿真结果  79-82
  4.4 生物数据分析  82-84
  4.5 结论  84-88
第五章 总结与展望  88-92
参考文献  92-102
攻读博士学位期间的研究成果  102-104
  论文情况  102-103
  参与的科研工作  103-104
致谢  104-105

相似论文

  1. 空间统计中的隐马尔可夫模型,F224
  2. 基因调控网络模型描述语言研究,Q78
  3. 融合多数据源构建基因调控网络,Q811.4
  4. 基于基因芯片的母猪妊娠相关基因调控网络构建,S828
  5. 可移动类进程代数及其静态分析技术在系统生物学领域中应用的研究,Q-33
  6. 基因表达谱芯片校正批次效应算法的比较及网络分析在精神分裂症研究中的应用,R749.3
  7. 统计建模分析高通量生物数据及其应用,O212.1
  8. 介观复杂体系中若干重要统计力学问题的理论研究,O488
  9. 睡眠剥夺问题的基因共表达网络分析方法研究,Q41
  10. 基于粗糙集聚类的基因调控网络的构建,TP18
  11. 脑瘤的基因网络建模与分析,R739.4
  12. 基于贝叶斯网络的基因调控网络的构建,TP183
  13. 拟南芥雄性不育突变性tdf1的基因克隆和功能分析,Q943.2
  14. 皮肤毛囊基因调控网络的初建及其在绒山羊上的功能预测,S827
  15. 海马组织发育过程中基因调控网络构建的生物动力学模型研究,R741
  16. 利用Lotka-Volterra方程构建小脑组织发育中基因的调控网络,R346
  17. 生物信息学方法研究内源性RNAi及其介导的基因调控网络,Q75
  18. 基于贝叶斯网络的基因调控网络构建算法的研究,TP183
  19. 基于进化计算方法的基因调控网络分析与重构,TP399
  20. 基于小波去噪和互谱估计的基因表达数据分析,Q78

中图分类: > 生物科学 > 分子生物学 > 分子遗传学
© 2012 www.xueweilunwen.com