学位论文 > 优秀研究生学位论文题录展示
基于多类特征融合的基因启动子相关问题的理论研究
作 者: 左永春
导 师: 李前忠
学 校: 内蒙古大学
专 业: 生物物理学
关键词: 转录调控 基因启动子 调控模体 位置调控 DNA几何结构 表观遗传标记 参数二次整合 支持向量机(SVM)
分类号: Q78
类 型: 博士论文
年 份: 2011年
下 载: 91次
引 用: 0次
阅 读: 论文下载
内容摘要
基因的表达调控体现在许多层面上,主要是转录水平的调控,阐明基因转录起始调控机制对于后基因组时代的基因组功能注释起到非常关键的作用。基因转录起始是由多种启动子识别因子共同作用的结果,基因组内部的启动子序列作为基因表达所必需的重要序列信号和基因转录水平上最重要的一种调控元件,对它们的研究是研究转录调控、下游靶基因以及信号通路的必不可少的手段。核心启动子的多态性如何与多种启动子识别因子相匹配己成为Pol-Ⅱ基因转录启动遇到的新难题。不同的基因可能存在完全不同的表达调控机制,使得不同物种启动子内部调控元件的组成存在较大的差异。GC碱基特征是影响启动子特性及下游相关基因表达非常重要的因素,功能元件的位置调控导致的基因功能变化在转录调控中也越来越显著。另外,核心启动子元件在统计上保守性不强,使得对基因启动子及其转录起始点(TSS)的识别精度远低于对蛋白质编码区域的识别。本文的工作主要是针对基因启动子功能区域的GC-Skew/Profile、位点保守性、DNA几何结构、调控模体的位置调控等相关特征和构建基于多特征融合的启动子识别模型两方面展开研究,主要研究成果如下:一、通过比较分析四类模式物种基因启动子在碱基组成上的偏好,证实了人类启动子序列典型的GC偏好特征,以及不同生物基因启动子具有独特的GC位点组成偏好和位点碱基偏差;发现人类启动子越接近TSS处位点保守性越强,果蝇启动子则在距离TSS位点-80bp的上游区域存在较显著位点保守性,而植物启动子除TATA-box和转录起始子(Inr)定位区域保守性较强外,其它区域无明显保守性。通过比较DNA空间几何结构柔性,发现了不同生物类型转录起始区域的独特DNA物理结构特异性和各向异性的特征规律,为实际的蛋白质-DNA相互作用过程提供一定的三维柔性结构参数。二、对启动子内部功能模体及定位分布的统计分析,证实了功能模体的位置调控与序列位点保守性规律一致,且不同物种间存在较大差异。找到了人类基因组启动子区域典型的-40bp元件—GGAAG调控模体,搜索出了集中出现在果蝇TSS上游-80bp以外区域的TA重复序列元件,并通过GO基因注释对调控模体的生物学意义进行了深入探究。三、着重比较了不同生物基因启动子内部的’TATA-box和TC-元件位点保守性和定位分布,发现TATA-box在果蝇启动子的197bp、-195bp、-184bp和-165bp等位点存在较大定位。TC-元件代表一类新的参与基因表达调控的功能模体,TC-重复元件大量存在于多类物种的TATA-box缺失的基因启动子中,偏好出现在一些环境特异性组织的启动子序列中,这些基因的转录只发生在某些特定器官或组织中。证实了真核基因启动子TATA-box末端富含嘌呤碱基“AAAA”的尾端,原核生物基因TATA-box模体除TATAAT外,尾端富含嘧啶碱基“GCGC”。通过比较不同σ类型的大肠杆菌启动子调控模体位置分布,找到了σ54启动子TSS上游的-24bp位点的CTGGCA模体和σ28启动子特有的TG[CA]CGATAA元件。四、通过对大肠杆菌启动子、编码区和基因间区域的DNA几何特征图谱的比较和分析,证明基于序列独立性的DNA几何柔性结构特征能够很好的反映原核生物转录起始区域的结构特异性。针对启动子识别中两个最关键的问题—特征提取和算法筛选,我们采用特征参数二次整合方法,构建了基于序列信号、组分及DNA几何结构的植物TATA和TATA-Less启动子识别模型,达到了目前国际最好预测效果。利用最新发表的组蛋白修饰信息,整合表观遗传标记特征和DNA序列信息构建了人类基因启动子识别算法,验证了组蛋白修饰对于启动子识别的重要性,讨论了染色质表观标记信息与信号、组分及DNA结构特征对于启动子预测精度的影响。
|
全文目录
摘要 4-6 ABSTRACT 6-10 第一章 绪论 10-19 1.1 研究背景和意义 10-11 1.2 国内外研究现状 11-17 1.2.1 原核启动子研究进展 11-12 1.2.2 真核启动子研究进展 12-16 1.2.3 组蛋白修饰与基因转录起始 16-17 1.3 本研究结构安排 17-19 第二章 启动子特征分析方法 19-25 2.1 启动子位点关联保守性 19 2.2 调控模体比较 19-21 2.2.1 WebLogo位点保守性表达 19-20 2.2.2 MEME调控模体搜寻 20-21 2.3 DNA局域几何结构描述 21-23 2.4 GC-Skew和GC-Profile定义 23-25 第三章 基因启动子特征分析 25-35 3.1 数据集的构建 25-26 3.2 启动子碱基组成及碱基短程关联偏好 26-28 3.3 转录起始区域的GC偏差分析 28-30 3.4 位点关联保守性分析 30-32 3.5 转录起始区域的DNA几何柔性 32-34 3.6 小结 34-35 第四章 调控模体的位置调控 35-44 4.1 转录起始位点周围的调控模体定位 35-38 4.2 TATA-box元件的定位保守性 38-40 4.3 TC-元件的定位保守性 40-41 4.4 不同σ类型启动子调控模体的定位分布 41-43 4.5 小结 43-44 第五章 特征提取和理论预测方法 44-50 5.1 算法发展现状 44-45 5.2 位置关联打分矩阵 45 5.3 离散增量 45-47 5.3.1 离散量和离散增量 45-47 5.3.2 离散增量算法 47 5.4 支持向量机 47-48 5.5 多模型组合的SVM算法 48 5.6 算法评价指标 48-50 第六章 整合DNA几何结构预测原核生物启动子 50-56 6.1 数据获取 50-51 6.2 DNA局域几何柔性分析 51-53 6.3 不同σ启动子的DNA几何柔性 53-54 6.4 大肠杆菌σ~(70)启动子预测 54-56 第七章 基于多特征融合的植物和人类启动子预测 56-74 7.1 植物启动子预测 56-67 7.1.1 数据选取 56-57 7.1.2 位点保守性分析 57-58 7.1.3 TATA和TATA-Less启动子调控模体差异 58-60 7.1.4 GC/AT-Skew分析 60-61 7.1.5 TATA和TATA-less启动子预测 61-65 7.1.6 拟南芥基因启动子区广范围注释 65-67 7.2 整合表观遗传学标记预测人类启动子 67-73 7.2.1 数据集获取 67 7.2.2 特征选取 67-70 7.2.3 人类CpG启动子预测结果 70-72 7.2.4 人类non-CpG启动子预测结果 72-73 7.3 本章小结 73-74 第八章 总结与展望 74-77 8.1 本文工作总结 74-75 8.2 工作展望 75-77 参考文献 77-92 附录 92-98 致谢 98-99 攻读博士学位期间发表和完成的学术论文 99-100
|
相似论文
- 多转录因子组合调控研究,Q78
- 猪BMP7基因启动子多态性及其与繁殖性状关联性分析,S828
- 霍乱弧菌LysR/MFS调控体系的功能研究,R378
- Pib结构基因在不同启动子驱动下的稻瘟病抗性,S435.111.41
- 水稻Pib启动子中乙烯和茉莉酸响应元件的转基因分析,S511
- 霍乱弧菌LysR家族基因vc2103的功能及其调控基因的研究,R346
- 苹果Flowering locus T (FT)基因及其启动子的克隆及表达分析,S661.1
- 丙型肝炎病毒NS2TP基因调节机制的研究,R512.63
- 豆蔻酰化修饰及质膜结合在烟草小GTP结合蛋白基因NtRab5b转录调控中的作用,Q943
- 小麦储藏蛋白基因avenin-like b启动子的表达特性研究,S512.1
- 小麦储藏蛋白基因Avenin-like b启动子的克隆及表达载体构建,S512.1
- 基于SVM-RFE的潜在生物标志物选择算法研究,TP311.13
- 曲古抑菌素A(TSA)在IFN-γ调控TRIM22表达中的作用及其机制研究,R346
- klotho基因启动子片段转录调控的初步研究,R346
- 智能化教学中的情感识别方法研究,TP391.41
- 转录因子Pax3对胶质纤维酸性蛋白基因的负性转录调控研究,Q42
- 通过可诱导途径提高植物抗旱性研究,Q945
- 人KCTD10基因启动子及其调控研究,Q987
- 高速公路交通安全综合评价和瓶颈问题分析,U492.8
- 梨S-RNase基因启动子克隆及雌雄不育植物表达载体构建,S661.2
- APE1基因遗传变异与宫颈癌发生风险及其机制探讨,R737.33
中图分类: > 生物科学 > 分子生物学 > 基因工程(遗传工程)
© 2012 www.xueweilunwen.com
|