学位论文 > 优秀研究生学位论文题录展示
蛋白质-DNA结构模型比较及其在转录因子结合位点预测中的应用
作 者: 陈凌
导 师: 王飞
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 生物信息学 数据挖掘 转录因子结合位点预测 蛋白质-DNA结构模型
分类号: Q51
类 型: 硕士论文
年 份: 2010年
下 载: 47次
引 用: 0次
阅 读: 论文下载
内容摘要
转录因子结合位点预测研究是生物信息学的热点问题之一,其目的是发现基因上游调控区域中对基因表达产生关键影响的调控元件。转录因子结合位点作为一种转录调控元件,是基因组中具有调控功能的DNA序列片段,对其进行识别和预测将有助于解释基因表达调控的规律。随着序列比对算法研究的深入和计算机技术的发展,通过计算机平台进行转录因子结合位点的识别与预测日益成为-项重要的辅助研究手段。准确而快速的预测算法有助于生物学家了解各种转录因子的目标基因,进一步研究结合位点对基因转录调控的影响,为生物学实验提供有价值的参考信息。目前,在该领域已经开发出许多转录因子结合位点预测算法和软件,如著名的MEME、AlignACE以及BioProspector。本文主要提出了一种基于蛋白质-DNA结构模型的转录因子结合位点预测算法,该算法克服了现有经典序列比对预测算法的两个不足之处,即:①识别精度受限于先验知识;②理论模型缺乏生物意义。算法以PDB数据库中的蛋白质-DNA复合物分子三维空间坐标文件为基础,建立相对应的化学、热动力学位置权重矩阵,以结构预测的方法识别目标转录因子的结合位点,并输出相应的结合位点序列集合。通过对转录因子结合位点数据库Jaspar的实验结果测试分析以及与现有经典结构模型预测算法比较,显示出本文算法是有效可行的。本文所提出的结构模型预测算法通过位置权重矩阵描述转录因子在各种结构特征下对结合位点的识别特异性,为今后的转录因子-核酸相互作用研究提供重要的结构分析线索和量化工具。本文算法作为一种预测转录因子结合位点的计算机辅助手段,对于那些希望通过分子结构特征进行蛋白质-DNA相互作用研究的生物学家具有重要的借鉴意义。
|
全文目录
摘要 6-7 Abstract 7-9 第一章 绪论 9-18 1.1 生物信息学概述 9-10 1.2 生物学背景知识 10-12 1.3 转录因子结合位点预测方法的研究现状 12-16 1.3.1 研究目的和意义 12-13 1.3.2 研究方法 13-15 1.3.3 现有算法的不足和问题 15-16 1.4 本文的主要工作与安排 16-18 第二章 转录因子结合位点表示方法 18-23 2.1 共有序列 18-19 2.2 序列标识 19-20 2.3 位置权重矩阵 20-21 2.4 总结 21-23 第三章 蛋白质-DNA结构模型综述 23-40 3.1 引言 23-25 3.2 蛋白质-DNA结构模型介绍 25-31 3.2.1 化学键配对结构模型 25-27 3.2.2 原子配对自由能结构模型 27-29 3.2.3 DNA分子形变自由能结构模型 29-31 3.3 结构模型对传统序列比对预测算法的改进 31-33 3.4 模型比较 33-36 3.4.1 蛋白质研究对象适用性 34-35 3.4.2 DNA随机序列集合的搜索计算复杂性 35-36 3.5 结构模型未来发展方向 36-38 3.5.1 模型的集成方法 36 3.5.2 DNA随机序列搜索算法优化 36-38 3.5.3 更广泛的结构特征应用 38 3.6 总结与展望 38-40 第四章 基于蛋白质-DNA结构模型的转录因子结合位点预测算法 40-63 4.1 引言 40-42 4.2 方法 42-47 4.2.1 氢键自由能 42-43 4.2.2 DNA分子形变自由能 43-44 4.2.3 构建氢键配对特征和DNA形变特征位置权重矩阵 44-46 4.2.4 基于原子聚类模型的位置权重矩阵 46 4.2.5 转录因子结合位点位置权重矩阵 46-47 4.3 实验 47-61 4.3.1 平均权重参数下算法性能比较 48-52 4.3.2 权重参数优化问题 52-53 4.3.3 计算最优权重参数 53 4.3.4 回文特点转录因子的权重参数优化 53-57 4.3.5 HTH家族转录因子的权重参数优化 57-60 4.3.6 实验结果总结 60-61 4.4 总结与展望 61-63 第五章 结束语 63-65 5.1 论文的主要成果 63 5.2 问题与展望 63-65 参考文献 65-74 硕士期间发表论文 74-75 致谢 75-76
|
相似论文
- BioLab面向生物计算服务的网格系统,TP399-C8
- 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
- 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
- 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
- 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
- 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
- 斯氏按蚊感染约氏疟原虫后24小时差异表达基因的筛选与分析,R531.3
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com
|