学位论文 > 优秀研究生学位论文题录展示

线粒体基因组揭示的人类进化中的自然选择和群体扩张

作 者: 郑鸿翔
导 师: 金力
学 校: 复旦大学
专 业: 遗传学
关键词: 线粒体全序 自然选择 适应性进化 分子动力学模拟 人群扩张 共祖时间
分类号: Q987
类 型: 博士论文
年 份: 2011年
下 载: 57次
引 用: 0次
阅 读: 论文下载
 

内容摘要


人类的线粒体DNA (Mitochondrial DNA, mtDNA),以其拷贝数高,突变率高,基因组小,无重组,单一的母系遗传等特点,成为了研究人类进化的一个常用分子标记,广泛地应用了到分子人类学和群体遗传学的研究中。线粒体是细胞的能量工厂,人体新陈代谢中90%的能量由线粒体产出。由mtDNA编码参与组成的电子传递链对底物进行氧化磷酸化,是线粒体产能的主要形式。所以,线粒体基因组在生命体内发挥着重要的作用。ntDNA上的突变会造成母系遗传病,代谢类疾病和老年性疾病。人类的线粒体DNA也因其编码蛋白质的重要功能而受到强烈的纯化选择,具体表现在群体内的年轻支系中出现更多的非同义突变。通过之前广泛的研究发现,人类mtDNA单倍群分布存在着显著的地区特异性。寒冷地区的支系相对于热带地区会富集更多的非同义突变,推断这可能是适应性进化的效应。本研究通过搜集全球已发表的人类mtDNA,通过最大似然法来检测序列中潜在的正向选择位点。并利用3122条随机序列,寻找线粒体序列中能够反映出纬度变化以及地区差异的位点。通过以上方法筛选得到了两个潜在的受到正向选择的位点(10398和14053位点),其具有A/G多态。随着纬度升高,人群中A频率上升,G频率则相应下降。10398和14053的A/G多态,分别导致复合体Ⅰ亚基3(ND3)114位和亚基5(ND5)573位苏氨酸(T)和丙氨酸(A)的变化。苏氨酸和丙氨酸在“α螺旋趋势性”的氨基酸性质上有显著差异,影响二级结构上是形成α螺旋或者是无规则的卷曲结构。通过构建哺乳动物mtDNA系统进化树,发现这两个氨基酸位点在哺乳动物进化中也产生过于多次的引起α螺旋趋势性性质显著改变的突变,意味着可能存在哺乳动物进化中的正向选择,从而验证了人群中的多态也有可能具有适应性。为了进一步研究氨基酸改变对蛋白功能结构的影响,通过对复合体Ⅰ的ND3亚基进行分子动力学模拟,结果发现ND3的114T多态使所在位置产生卷曲结构,并且相对于114A多态作用范围更广,有利于亚基对于质子的结合,而苏氨酸的亲水性也有利于吸引水分子。以上特征都将有利于加快质子转运的速率。质子运转加快会提高代谢率,促进新陈代谢,与10398的A多态(氨基酸多态为T)的单倍型多富集于较高纬度地区,需要加快代谢速率来抵御寒冷的现象所一致。而通过人类mtDNA进化树对每一次的10398和14053突变都进行分析,发现在较低纬度地区产生了多次的A->G(氨基酸T->A)的转变,可能的解释是减缓的代谢率对于食物的需求降低,而在人类食物匮乏的采集狩猎者社会可能具有选择优势。这也与G多态(氨基酸多态为A)多富集于较低纬度地区的趋势所一致。从而本文推断,在人类进化中,10398和14053是两个潜在的受到正向选择的位点,值得通过实验等功能分析进一步研究。此外,本文通过对于复活节岛人群的研究,发现了线粒体序列A3511G(氨基酸ND1T69A)的突变。由于之前研究显示丙氨酸会减缓质子转运速率,3511G在复活节岛人中的固定可能是受到长途航海旅行中食物匮乏的选择压力所影响。本研究不仅寻找到了人类进化中mtDNA中的正向选择效应,还通过其来估计人群历史上的群体数量变化。在现代人类进化中,人群的扩张与农业文明产生之间的关系也一直是学术界持有争议的问题。想要回答这个问题,需要对人群进行大规模随机采样并且无偏倚地测序,来获得对于支系扩张和群体扩张的精确时间估计,并与当地的新石器时期起始时间作比较。而千人基因组计划在全球范围内的大规模随机采样并且高通量测序,为研究带来了重要的材料。本文首先以东亚地区为突破口,分析了所有获得的千人基因组计划在东亚地区所采集的随机样本,总共367条线粒体全基因组序列,包括249条中国群体序列(CHB, CHD和CHS)以及118条日本群体序列(JPT)。结果发现,除了两个日本特有的支系外,所有的东亚人群中发生扩张的支系(D4, D4b2b, D4a, D4j, D5a2a, A, N9a, F1a1’4, F2, B4, B4a, G2a1, M7b1’2’4)均在1万年前或更早的时间已经扩张,而这些支系已经构成了现代东亚群体的主体。现代人类的农业文明被认为是在大约1万年多年前在西亚最早出现的,而在之后的5千年内在非洲,东亚,美洲分别都有独立的起源。在东亚,农业文明的起源以距今7.9千年前的大地湾文明作为标志,可见先前估算的东亚人群主要支系扩张时间发生在新石器时期到来之前。本文继而分析了东亚人群的群体扩张时间,发现其始于1.3万年前,并且一直延续到距今4千年前,即仍旧在新石器时期之前。此外,对世界农业起源产生重要影响的非洲,欧洲和美洲地区总共11个群体736条随机序列进行分析,也发现了类似东亚的人口扩张模式,即主要的人群扩张是始于当地的农业起源之前。根据以上观察,本文提出了农业产生的一个新的假说:末次盛冰期结束后气候变暖,世界各地的人群开始扩张,这一扩张造成的对食物的需求可能是农业产生的主要动因,而农业的产生和发展,又进一步推动了人群的继续扩张。

全文目录


摘要  9-11
Abstract  11-14
前言  14-15
第一章 从线粒体全序来看人类进化  15-50
  1.1 线粒体的遗传学  15-20
    1.1.1 母系遗传  17-18
    1.1.2 无重组事件  18
    1.1.3 高突变率  18-19
    1.1.4 高拷贝数量  19
    1.1.5 低有效群体数量  19-20
  1.2 线粒体与产能  20-21
  1.3 线粒体与疾病  21-22
  1.4 线粒体DNA标记与人类进化  22-32
    1.4.1 现代人非洲起源学说  23
    1.4.2 现代人线粒体支系及分布  23-31
    1.4.3 人类线粒体的全序分析  31-32
  1.5 线粒体与现代人群中的自然选择  32-36
  1.6 参考文献  36-50
第二章 全球人类线粒体序列蛋白质编码区正选择分析  50-69
  2.1 背景介绍  50-52
  2.2 方法  52-57
    2.2.1 样本采集  52-53
    2.2.2 随机样本的挑选原则  53-54
    2.2.3 群体d_N/d_s分析  54-55
    2.2.4 按照纬度的回归分析  55-56
    2.2.5 区域差异分析  56-57
  2.3 结果和讨论  57-63
    2.3.1 群体d_N/d_s分析  57-61
    2.3.2 回归分析  61
    2.3.3 区域差异分析  61-63
  2.4 结论  63-66
  2.5 参考文献  66-69
第三章 线粒体序列潜在受选位点的物种间进化分析  69-79
  3.1 背景介绍  69-70
  3.2 方法  70-71
    3.2.1 样本采集  70
    3.2.2 系统进化树重构  70-71
    3.2.3 多物种序列适应性进化分析  71
    3.2.4 多物种关联分析  71
  3.3 结果和讨论  71-76
    3.3.1 系统发生树构建  71-73
    3.3.2 蛋白质序列分析  73-75
    3.3.3 突变位点与哺乳动物运动速率的关联分析  75-76
  3.4 结论  76-78
  3.5 参考文献  78-79
第四章 线粒体复合体Ⅰ亚基3的三维结构分析  79-93
  4.1 背景介绍  79-80
  4.2 方法  80-82
    4.2.1 从头结构预测  80
    4.2.2 同源模建  80
    4.2.3 分子动力学模拟  80-82
    4.2.4 原子轨迹分析  82
  4.3 结果  82-83
  4.4 讨论  83-88
  4.5 结论  88-90
  4.6 参考文献  90-93
第五章 线粒体序列潜在受选位点的单倍群分析  93-129
  5.1 背景介绍  93-94
  5.2 方法  94-96
    5.2.1 样本数据  94
    5.2.2 区域频率计算  94-95
    5.2.3 支系频谱检验  95
    5.2.4 进化网络构建  95
    5.2.5 支系共祖年代估计  95-96
  5.3 结果  96-122
    5.3.1 10398位点支系分析  96-121
      5.3.1.1 Llclal  96
      5.3.1.2 L3ela3  96-97
      5.3.1.3 Y  97-101
      5.3.1.4 S3  101
      5.3.1.5 P4  101-102
      5.3.1.6 R21'12  102
      5.3.1.7 R0a2k  102
      5.3.1.8 A2~*  102-104
      5.3.1.9 B4clc  104-105
      5.3.1.10 B5  105-107
      5.3.1.11 R11  107-109
      5.3.1.12 Nla'e'I  109-110
      5.3.1.13 J  110-113
      5.3.1.14 Jlc8  113-114
      5.3.1.15 Kl  114-118
      5.3.1.16 10398位点总结讨论  118-121
    5.3.2 14053支系分析  121
    5.3.3 关于原来的线粒体选择理论  121-122
    5.3.4 关于先前研究中对于10398位点的报道  122
  5.4 结论  122-125
  5.5 参考文献  125-129
第六章 复活节岛线粒体全序分析  129-140
  6.1 介绍  129-130
  6.2 方法  130-131
    6.2.1 样本采集  130
    6.2.2 时间估计  130
    6.2.3 自然选择分析  130-131
  6.3 结果和讨论  131-136
  6.4 结论  136-137
  6.5 参考文献  137-140
第七章 东亚地区线粒体序列揭示的人口扩张和农业起源  140-160
  7.1 背景介绍  140-142
  7.2 方法  142-144
    7.2.1 人群和样本  142
    7.2.2 线粒体全序组装  142-143
    7.2.3 单倍型判定  143
    7.2.4 数据分析  143-144
  7.3 结果  144-149
  7.4 讨论  149-155
    7.4.1 东亚群体的代表性  149-150
    7.4.2 时间估算不同方法的一致性  150-153
    7.4.3 群体扩张模拟  153-154
    7.4.4 农业起源的具体时间  154-155
  7.5 结论  155-156
  7.6 参考文献  156-160
第八章 全球线粒体序列揭示的人口扩张和农业起源  160-174
  8.1 背景介绍  160-161
  8.2 材料与方法  161
    8.2.1 样本采集  161
    8.2.2 数据分析  161
  8.3 结果与讨论  161-164
    8.3.1 非洲线粒体支系扩张和群体扩张  161-162
    8.3.2 欧洲线粒体支系扩张和群体扩张  162-164
    8.3.3 美洲线粒体支系扩张和群体扩张  164
  8.4 结论  164-172
  8.5 参考文献  172-174
附表1:3122条随机mtDNA全测数据来源  174-183
附表2:所挑选出的55条人类线粒体全测序列及其单倍型  183-184
附表3:在复活节岛线粒体全序分析中所使用的200条文献报道的线粒体序列  184-190
  参考文献  187-190
致谢  190-192
发表论文  192-193

相似论文

  1. 不同类型亲水性结构表面修饰的聚氨酯材料与凝血十二因子九肽片段及纤维蛋白原P1片段相互作用的计算机模拟,O631.3
  2. 不同电性纳米碳管共价修饰FAD的分子动力学模拟研究,TB383.1
  3. 秦岭冷杉和巴山冷杉物种分化和谱系地理学研究,S791.14
  4. 不同海拔三个藏族人群HIF-1α基因与HIF-2α基因多态位点的比较研究,Q987
  5. 铅的激光烧蚀坑模拟及单脉冲激光诱导击穿光谱检测,TN247
  6. 纳米碳管的盐水通道行为研究,TB383.1
  7. 产酸丙酸杆菌发酵生产丙酸过程优化与控制研究,TQ225.123
  8. 天山北坡十字花科六种短命植物种群适应与果实多态的关系研究,Q948
  9. 提升光滑球拟酵母酸耐受性加强丙酮酸合成,TQ921.7
  10. 紫萼(Hosta ventricosa)开花物候与两性适合度的关系,Q948.1
  11. 基于PCR方法检测转座子对拟南芥基因进化的适应性研究,Q943.2
  12. 天山北部拟南芥等十字花科短命植物果实开裂难易的生态适应研究,Q948
  13. 绒螯蟹的分子遗传变异与进化,S917.4
  14. 蒯因论归纳问题,N02
  15. 离子液体[Bmim]Cl在水中PMF的分子动力学模拟,TQ013
  16. 禾本科祖先分枝的插曲式适应性进化研究,Q941.2
  17. 压力条件下橡胶分子运动及分子动力学模拟研究,TQ330.1
  18. 铅的激光诱导击穿光谱研究:形貌模拟与检测应用,TN241
  19. 哈尔滨地区黑斑蛙(Rana nigromaculata)夏季皮肤抗菌肽多样性的研究,S917.4
  20. 草鱼穿孔素等基因的克隆、表达特性及功能分析,S917.4
  21. 聚合物微器件超声波联接机理与方法研究,TG663

中图分类: > 生物科学 > 人类学 > 人类遗传学
© 2012 www.xueweilunwen.com