学位论文 > 优秀研究生学位论文题录展示
蛋白质结构分类研究
作 者: 于晓丽
导 师: 韩榕生
学 校: 华北电力大学(北京)
专 业: 理论物理
关键词: 生物信息学 序列比对 蛋白质结构分类
分类号: Q51
类 型: 硕士论文
年 份: 2011年
下 载: 137次
引 用: 0次
阅 读: 论文下载
内容摘要
生物信息学是一门新兴的采用计算机技术和信息技术研究生命科学中各种生物信息的表达,采集,存储,检索和分析的交叉学科,它是现代生命科学与信息科学、计算机科学、数学、统计学、物理学、化学等学科的相互渗透而又高度交叉形成的一门新兴学科。本文的研究对象是蛋白质结构数据库。实验上测得的蛋白质数据通常储存在数据库中,并按不同的性质分类。由于在演化过程中,蛋白质的结构通常比序列和功能更为保守,蛋白质的分类通常首先进行结构分类,然后按照序列和功能进行分类。蛋白质结构分类可以包括不同层次,如折叠类型,拓扑结构,家族,超家族,结构域,二级结构等。已经上网的蛋白质结构分类数据库很多,其中最具代表性,应用最为广泛的三个结构分类数据库是SCOP、CATH、FSSP。本文针对这些数据库的不足,采用多序列联配来替换双序列比对和人工的方法,来聚类具有相似结构的蛋白质。多序列联配方法可以获得很多的蛋白质性质,我们采用粗糙集理论中的知识约简技术来筛选,发现蛋白质结构保守核的长度与正确的蛋白质聚类有很强的关联,是用来构建聚类距离的非常合适的结构属性。最后我们对SCOP数据库中具有完整结构信息的35个家族进行了检验,获得了很好的结果。
|
全文目录
摘要 5 Abstract 5-9 第1章 绪论 9-15 1.1 课题的发展状况与研究的目的和意义 9-11 1.1.1 研究意义 9-10 1.1.2 国内外研究现状 10-11 1.2 生物信息与生物信息学 11-14 1.2.1 急剧增长的生物信息 11-13 1.2.2 生物信息学的概念 13-14 1.2.3 生物信息学的发展 14 1.3 本文研究内容 14-15 第2章 蛋白质结构分类依据 15-31 2.1 引言 15 2.2 序列比对 15-26 2.2.1 双序列比对 16-25 2.2.1.1 Needleman-wunsch算法 16-19 2.2.1.2 Smith-wateman算法 19-22 2.2.1.3 替换矩阵 22-25 2.2.2 多序列比对 25-26 2.2.2.1 动态规划算法 25-26 2.2.2.2 渐进算法 26 2.3 结构比对 26-29 2.3.1 蛋白质结构 27-28 2.3.2 结构比对 28-29 2.4 我们采用的多结构聚类软件:MAMMOTH-mult 29-30 2.5 本章小结 30-31 第3章 蛋白质结构分类数据库 31-36 3.1 引言 31 3.2 分类数据库 31-34 3.2.1 SCOP分类数据库 31-32 3.2.2 CATH分类数据库 32-33 3.2.3 FSSP分类数据库 33-34 3.3 蛋白质分类数据库评价 34-35 3.4 本章小结 35-36 第4章 我们的工作:基于多结构比对的分类方法 36-45 4.1 对SCOP、CATH、和FSSP数据库的分析 36 4.2 基于多结构比对聚类的理论基础 36-37 4.3 蛋白质结构数据集的筛选 37 4.4 聚类距离函数的确定 37-40 4.4.1 粗糙集理论 38 4.4.2 知识的表达系统——决策表 38-39 4.4.3 知识约简 39-40 4.5 基于多结构比对的聚类结果 40-44 4.6 本章小结 44-45 第5章 结论与展望 45-46 参考文献 46-49 攻读硕士学位期间发表的论文及其它成果 49-50 致谢 50
|
相似论文
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- BioLab面向生物计算服务的网格系统,TP399-C8
- 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
- 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
- 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
- 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
- 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
- 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
- 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
- 斯氏按蚊感染约氏疟原虫后24小时差异表达基因的筛选与分析,R531.3
- 家蚕HSP基因的表达调控研究,S881.2
- 电离辐射诱发microRNA表达改变及其对辐射损伤调控机制,R144
- 古细菌生物域内氨基酸替代矩阵的构建,Q936
- 网络协议的自动化Fuzz Testing漏洞挖掘方法,TP393.08
- 上海近郊某地区犬Torque Teno virus感染率调查及全基因组序列分析,S858.292
- 蛋白质-DNA结构模型比较及其在转录因子结合位点预测中的应用,Q51
- 生物途径数字化策略及其在共生固氮网络数据库中的实现,Q811.4
- 面向DAG数据依赖型应用系统研究与实现,TP311.1
- 拓展的隐马氏模型和基于遗传算法的参数估计方法,O211.62
- 桉树木质素合成途径两个关键基因的克隆与功能研究,S792.39
- 新疆梨种质资源分子标记及自交不亲和基因克隆,S661.2
中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com
|