学位论文 > 优秀研究生学位论文题录展示
基于序列编码的蛋白质分类问题研究
作 者: 彭婷
导 师: 廖波
学 校: 湖南大学
专 业: 信息与通信工程
关键词: 蛋白质分类 结构型分类 亚细胞定位 序列编码 支持向量机
分类号: Q51
类 型: 硕士论文
年 份: 2013年
下 载: 6次
引 用: 0次
阅 读: 论文下载
内容摘要
蛋白质分类问题作为蛋白质组学研究中的一个重要分支,近些年已吸引了越来越多研究者的关注。对蛋白质相关分类问题的研究是全面掌握蛋白质结构及功能的前提与基础,也在细胞生物学、分子生物学、医学和药理学中有着极其重要的角色扮演。一般情况下,蛋白质的分类问题研究均可以分为如下三个步骤:构建合理的数据集、设计有效的序列编码方案以及采取高性能的分类算法。本文围绕蛋白质分类问题预测这一主题,主要针对蛋白质序列的编码方法及分类预测算法两方面进行了深入研究,主要工作包括:1.针对蛋白质结构型分类预测问题,基于序列信息及二级结构特征提出了一种新的蛋白质序列编码方法。结合支持向量机分类算法,构建了一种全新的、比较实用的蛋白质结构型分类模型。该预测模型不需要引入任何其它信息,具有计算简单、快速的优点,针对四个标准数据集的刀切法检验都获得了较高的总体分类精度。另外,在经过对分类模型参数选择问题的讨论及一系列对比实验验证之后,结果表明,本文构建的分类预测模型具有较强的自适应、泛化和推广应用能力。2.针对蛋白质亚细胞定位分类预测问题,本文主要对蛋白质序列的编码问题及预测模型展开了研究。首先,文章提出了从不同视角对蛋白质序列进行编码的方案,其中引入了用于序列可视化的混沌游戏表示方法及新的序列统计信息的抽取方法;其次,本文选择在复空间对两部分特征向量进行并行融合,然后将该向量作为一致性距离统计分类的输入,并在两个标准数据集上验证所构建预测模型的可行性与效用性,接着将本文方法与已有工作进行比较,实验结果表明,预测模型从序列编码到分类预测等环节都采取了较为合理的处理方式,因此构建出的整个预测模型是合理且有效的。
|
全文目录
摘要 5-6 Abstract 6-12 第1章 绪论 12-21 1.1 引言 12-13 1.2 研究背景及意义 13-15 1.2.1 关于结构型的分类预测 13-14 1.2.2 关于亚细胞定位的分类预测 14-15 1.3 国内外研究现状 15-19 1.3.1 基于结构型分类预测的研究现状 15-16 1.3.2 基于亚细胞定位分类预测的研究现状 16-19 1.4 论文研究内容与结构安排 19-21 1.4.1 主要研究内容 19 1.4.2 论文结构安排 19-21 第2章 蛋白质分类问题的一般研究方法 21-36 2.1 蛋白质相关基础知识介绍 21-25 2.1.1 蛋白质的组成结构 21-23 2.1.2 亚细胞结构及其功能 23-25 2.2 数据集的构建 25-26 2.3 基于序列编码的特征提取方法 26-28 2.3.1 基于氨基酸组成及位置的方法 26-27 2.3.2 基于氨基酸物理化学特性的特征提取算法 27-28 2.3.3 其它序列特征提取算法 28 2.4 蛋白质分类算法 28-34 2.4.1 基于统计的分类预测方法 29-30 2.4.2 基于机器学习的分类预测方法 30-34 2.5 预测性能的评估 34-35 2.6 小结 35-36 第3章 基于序列信息及二级结构特征的蛋白质结构类预测方法 36-45 3.1 引言 36 3.2 蛋白质序列特征信息的提取 36-38 3.3 二级结构特征信息抽取 38-40 3.4 实验与分析 40-44 3.4.1 数据集构建及数据归一化 40-41 3.4.2 预测结果的比较与分析 41-43 3.4.3 特征参数的选取对预测结果的影响 43-44 3.5 小结 44-45 第4章 基于多特征融合的蛋白质亚细胞定位预测方法 45-56 4.1 引言 45 4.2 蛋白质序列编码 45-51 4.2.1 广义混沌游戏表示 45-50 4.2.2 序列统计信息抽取 50-51 4.3 实验与分析 51-55 4.3.1 数据集的构建 51-52 4.3.2 一致距离 (Unitary Distance) 52-53 4.3.3 统计分类预测效果 53-54 4.3.4 机器学习分类预测效果 54-55 4.4 小结 55-56 结论 56-58 参考文献 58-64 附录 A 攻读学位期间所发表的学术论文及所参加项目 64-65 致谢 65
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 草鱼呼肠孤病毒vp5、vp7基因cDNA的克隆、表达及VP5、VP7蛋白亚细胞定位研究,S941.41
- 小麦黄花叶病毒(WYMV)RNA2编码基因的功能研究,S435.121
- 单细胞中光敏化单态氧的间接成像,Q2-3
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 转录因子在棉纤维起始期的表达特征及三个转录因子基因的克隆与功能初步分析,Q943
- 玉米光周期敏感基因ZmELF4的克隆及功能验证,S513
- 小麦Na~+/H~+逆转运蛋白TaNHX2的功能验证及功能域分析,S512.1
- ABA诱导的OsDMI3基因的表达分析与亚细胞定位,S511
- ABA诱导的玉米叶片ZmCCaMK活性研究及亚细胞定位,S513
中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com
|