学位论文 > 优秀研究生学位论文题录展示
基于监督流形学习算法的固有不规则蛋白质结构预测研究
作 者: 范岩
导 师: 王科俊
学 校: 哈尔滨工程大学
专 业: 控制理论与控制工程
关键词: 固有不规则蛋白质 支持向量机 局部线性嵌入 Adaboost算法 序列属性
分类号: Q51
类 型: 硕士论文
年 份: 2011年
下 载: 6次
引 用: 0次
阅 读: 论文下载
内容摘要
随着人类基因组计划的顺利进展,越来越多的蛋白质序列被测定出来,而利用实验方法测量蛋白质及生物大分子的结构相当繁琐,既耗时又费力,因此利用理论计算方法来研究蛋白质的结构和功能从而指导实验是一项非常有意义的工作。本文从蛋白质的一级序列出发使用多分类器组合算法对固有不规则蛋白质结构进行分类研究,论文主要工作如下:1、构建规则和不规则蛋白质序列这两类序列集,依据长度不同的不规则蛋白质序列中氨基酸残基含量的不同,将不规则数据集分为长(>30个氨基酸残基)和短(≤30个氨基酸残基)两个序列集。2、基于氨基酸序列的单肽、双肽结构属性和疏水性物理属性出发,利用滑动窗口法将氨基酸序列量化,利用径向基核函数的支持向量机方法构建成员预测器模型。利用5倍交叉验证法确定长、短序列的窗口长度以及由此确定支持向量机核函数的参数值gamma值和惩罚系数coat值。3、在特征提取方面,由于滑动窗口法得到的数据矩阵容易形成维灾难,需要对矩阵进行维数规约,即将数据由高维空间投影到低维空间。主要分析了现在常用的降维方法包括线性降维方法中主成分分析法(PCA)以及一种基于PCA方法发展起来的一种非线性降维方法-核主成分分析法(KPCA)。在此基础上本文将流形学习算法中局部线性嵌入法(LLE)引入了固有不规则蛋白质结构预测中,并利用实验方法对PCA、KPCA以及LLE算法进行了验证,得出基于LLE方法的降维效果最好,从而得出蛋白质序列中氨基酸残基之间存在局部线性关系。4、为了提高固有不规则蛋白质结构预测精度,本文提出了一种基于Adaboost算法的SVM预测器融合方法预测固有不规则蛋白质结构。因此了解了预测器融合的基本概念、体系框架、成员预测器的设计方法以及Adaboost算法的基本原理和实现步骤。通过实验结果可以看出,利用多预测器融合算法后的预测精度明显优于单个成员预测器的预测精度。
|
全文目录
摘要 5-6ABSTRACT 6-10第1章 绪论 10-20 1.1 论文的背景和意义 10-12 1.1.1 研究背景 10-11 1.1.2 研究意义 11-12 1.2 固有不规则蛋白质结构预测器的研究现状 12-17 1.3 固有不规则蛋白质研究存在的难点 17-18 1.4 本文的主要工作内容 18-19 1.5 本文的章节安排 19-20第2章 固有不规则蛋白质 20-28 2.1 引言 20 2.2 氨基酸 20-22 2.3 固有不规则蛋白质的结构特点 22-24 2.4 固有不规则蛋白质的功能 24-26 2.5 固有不规则蛋白质在细胞中的分布 26-27 2.6 本章小结 27-28第3章 基于监督流形学习算法的特征提取 28-42 3.1 引言 28 3.2 常用的特征提取方法 28-34 3.2.1 主成分分析 28-31 3.2.2 核主成分分析 31-34 3.3 局部线性嵌入的流形学习 34-38 3.3.1 流形学习中的数学概念 35-36 3.3.2 局部线性嵌入的流形学习算法 36-38 3.4 基于局部线性嵌入算法的特征提取 38-40 3.4.1 实验过程 38-39 3.4.2 实验结果与分析 39-40 3.5 本章小结 40-42第4章 基于支持向量机的固有不规则蛋白质结构预测 42-56 4.1 引言 42 4.2 常用的固有不规则蛋白质结构预测方法介绍 42-44 4.2.1 人工神经网络方法 42-43 4.2.2 最近邻方法 43 4.2.3 贝叶斯方法 43-44 4.2.4 支持向量机方法 44 4.3 支持向量机理论基础 44-49 4.3.1 最优分类面 45-47 4.3.2 核函数 47-48 4.3.3 基于支持向量机构建预测器过程 48-49 4.4 数据集的选取和建模过程及评价指标 49-53 4.4.1 数据来源 49-51 4.4.2 滑动窗口法 51-52 4.4.3 预测器建模过程与评价指标 52-53 4.5 实验结果分析 53-55 4.5.1 参数选择 53-54 4.5.2 结果与分析 54-55 4.6 本章小结 55-56第5章 基于多预测器融合算法的固有不规则蛋白质结构预测 56-67 5.1 引言 56 5.2 多预测器融合 56-60 5.2.1 预测器融合的基本概念 57 5.2.2 多预测器融合的体系框架 57-58 5.2.3 成员预测器的设计方法 58-59 5.2.4 Adaboost算法 59-60 5.3 基于Adaboost算法预测固有不规则蛋白质结构 60-66 5.3.1 氨基酸序列的特征向量选择 61-63 5.3.2 窗口长度的选择 63-64 5.3.3 多预测器融合算法实验 64-66 5.4 本章小结 66-67结论 67-69参考文献 69-77攻读硕士学位期间发表的论文和取得的科研成果 77-78致谢 78
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于流形学习的数据降维技术研究,TP311.13
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
中图分类: > 生物科学 > 生物化学 > 蛋白质
© 2012 www.xueweilunwen.com
|