学位论文 > 优秀研究生学位论文题录展示
基于哈斯矩阵图的蛋白质序列分类及可视化方法研究
作 者: 徐培杰
导 师: 肖绚
学 校: 景德镇陶瓷学院
专 业: 控制理论与控制工程
关键词: 生物信息学 特征提取 哈斯矩阵 偏序
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 31次
引 用: 0次
阅 读: 论文下载
内容摘要
蛋白质序列的分类及可视化一直是蛋白质组学研究的重要组成部分,掌握蛋白质的组成结构与具体功能的前提和基础就是要把大量的蛋白质序列进行分类,而可视化方法使整个研究变得非常直观。本文详细分析研究了蛋白质序列可视化方法及其特征提取,提出了一种新颖的可视化方法来描述蛋白质序列,并基于这种可视化方法对蛋白质序列进行分类,如蛋白质二级结构类型分类,分泌蛋白分类,G蛋白偶联受体分类等,预测成功率比现有预测器都有提高。利用氨基酸物理化学性质的数字编码模型,基于偏序理论,对每条氨基酸序列构建了一个改进的哈斯矩阵,为了能够更直观的分析,我们用彩色图像来使矩阵可视化。此外,为了作定量分析,我们把哈斯矩阵转化为灰度共生矩阵,然后对不同序列的相似度进行比较。本文的主要工作概括如下:1)利用氨基酸数字编码模型,把氨基酸的物理化学性质加入到数字序列中通过反映氨基酸亲水性、疏水性和侧链分子量的数字编码模型,将一条蛋白质序列转换成三条不同的数字序列。2)把偏序理论与哈斯矩阵运用到生物信息学当中基于偏序理论构建改进的哈斯矩阵:对蛋白质序列中不同位置上的氨基酸,根据不同物理化学特性进行两两比较,可以构成三个哈斯矩阵,基于所得三个哈斯矩阵可得到反映序列全特性的改进的哈斯矩阵。3)提出一种简单新颖的可视化技术并运用到生物信息学中改进的哈斯矩阵元素由“0”到“7”这8个数字构成,通过可视化技术将八个数字“0”表示黑色,“1”表示蓝色,“2”表示绿色,“3”表示蓝绿色,“4”表示红色,“5”表示杨红色,“6”表示黄色,“7”表示白色,得到具有蛋白质全序列特征的可视化图像。4)利用改进的哈斯矩阵图方法并通过图像模式识别方法对蛋白质二级结构、分泌蛋白、G蛋白偶联受进行分类预测,效果都非常理想。
|
全文目录
摘要 3-4 Abstract 4-7 1 绪论 7-12 1.1 引言 7-8 1.2 蛋白质序列分析的国内外研究进展 8-10 1.3 主要研究内容 10-12 1.3.1 研究创新点 10 1.3.2 研究内容安排 10-12 2 基于哈斯矩阵图的蛋白质序列可视化模型及其图像纹理特征提取方法 12-33 2.1 蛋白质序列的数字编码模型 12-13 2.2 偏序理论与哈斯矩阵 13-17 2.2.1 偏序理论方法 13-14 2.2.2 哈斯矩阵及其改进方法 14-17 2.3 序列可视化技术 17-22 2.3.1 现有的序列可视化方法 17 2.3.2 基因序列二维可视化 17-18 2.3.3 三维空间轨迹基因序列可视化 18-19 2.3.4 DNA 序列的Z 曲线可视化 19-20 2.3.5 本文的可视化方法 20-22 2.4 图像特征提取算法 22-26 2.4.1 基于图像灰度直方图的特征提取 22-23 2.4.2 基于图像灰度差值直方图的特征提取 23 2.4.3 基于图像灰度共生矩阵的特征提取 23-25 2.4.4 基于图像几何距的特征提取 25-26 2.5 蛋白质分类算法 26-30 2.5.1 模糊K 近邻方法 27-28 2.5.2 组分耦合算法 28-29 2.5.3 贝叶斯分类算法 29-30 2.6 模型的检验与评估 30-32 2.6.1 模型的检验 30-31 2.6.2 模型的评估 31-32 2.7 本章小结 32-33 3 基于哈斯矩阵的蛋白质序列相似度研究 33-39 3.1 灰度共生矩阵 33-34 3.2 序列可视化 34-36 3.3 基于哈斯矩阵的序列相似度研究 36-37 3.4 本章小结 37-39 4 基于哈斯矩阵图的蛋白质二级结构预测 39-43 4.1 蛋白质二级结构预测方法 40-41 4.2 基于哈斯矩阵图的蛋白质二级结构预测方法与结果 41-42 4.3 本章小结 42-43 5 基于哈斯矩阵图的分泌蛋白预测 43-49 5.1 现有分类方法 45 5.2 基于哈斯矩阵图的分泌蛋白类型预测 45-48 5.3 本章小结 48-49 6 基于哈斯矩阵图的G 蛋白偶联受体预测 49-54 6.1 GPCR 分类 49-51 6.2 GPCR 数据集构建 51-52 6.3 基于哈斯矩阵图的GPCR 预测 52-53 6.4 本章小结 53-54 7 结论与展望 54-56 7.1 研究结论 54 7.2 工作展望 54-56 致谢 56-57 参考文献 57-61 攻读硕士学位期间参加的项目和所发表及录用的论文 61
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- BioLab面向生物计算服务的网格系统,TP399-C8
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|