学位论文 > 优秀研究生学位论文题录展示
频谱分析识别串联重复序列
作 者: 毛伟伟
导 师: 聂俊岚
学 校: 燕山大学
专 业: 计算机系统结构
关键词: 串联重复 参数谱估计 AR模型 电子离子相互作用电势 频谱分析
分类号: Q811.4
类 型: 硕士论文
年 份: 2010年
下 载: 63次
引 用: 0次
阅 读: 论文下载
内容摘要
串联重复序列识别是生物信息学中一个重要的、具有挑战性的课题,对于发现基因序列中某些特定序列的功能和遗传特性具有非常重要的意义。随着基因组测序工作的完成,大量的生物基因序列被人类发现并存储在基因数据库中,急需对这些基因数据进行分析处理。目前已有大量的串联重复序列识别方法,大体分为两类:一类是基于字符串匹配的识别方法;另一类是基于数字信号处理的方法。本课题将要研究的是第二类方法,在分析了国内外此类识别方法之后发现,此类方法在计算量及识别准确性方面仍然不够完善。本文主要针对现有识别方法存在的计算量过大,识别准确性不高的问题进行研究。首先,介绍了串联重复序列的相关概念及一些生物学的基本理论,深入分析了国内外串联重复序列识别方法的研究现状,详细阐述了几种具有代表性的识别方法的优缺点。其次,分析了基于离散傅里叶变换的串联重复序列识别方法的优缺点,并针对其存在的不足进行了改进。提出了一种基于碱基EIIP的基因数字化表示方法,将碱基的EIIP作为基因序列数字化表示的依据,一条基因序列可以唯一的表示为一条数字序列,减小了计算频谱图的计算量。再次,对PSE识别方法进行了深入分析,针对PSE识别法中存在的不足,提出了基于AR模型的串联重复序列识别方法。解决了PSE识别法中存在的计算量大、阶次估计不准确及可能会出现的谱峰分裂问题。最后,对本文提出的方法进行了实验验证与分析。将实验结果与已有识别方法及GenBank数据库中的标注信息进行对比,验证了方法的正确性及有效性。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-16 1.1 研究背景与意义 10-11 1.2 国内外研究现状及分析 11-14 1.3 课题研究内容 14-15 1.4 论文的组织结构 15-16 第2章 生物学基础理论及相关知识 16-26 2.1 基因和蛋白质 16-17 2.1.1 DNA 分子结构 16 2.1.2 基因及其表达 16-17 2.1.3 氨基酸与蛋白质 17 2.2 基因组中的重复序列 17-22 2.2.1 串联重复序列的相关定义 19-20 2.2.2 串联重复序列的分类 20-22 2.3 数字信号处理相关知识 22-23 2.3.1 离散傅里叶变换 22-23 2.3.2 功率谱分析方法的基本原理 23 2.4 基准参考数据库 23-25 2.5 本章小结 25-26 第3章 改进的基于离散傅里叶变换的串联重复序列识别方法 26-38 3.1 引言 26 3.2 已有识别方法分析 26-28 3.2.1 SRF 及傅里叶乘积法 27 3.2.2 SRF 及傅里叶乘积法的局限性 27-28 3.3 基于傅里叶变换的串联重复的识别方法改进 28-37 3.3.1 将基因序列映射成为数字序列 28-29 3.3.2 基因序列的频谱分析 29-31 3.3.3 信噪比的设置 31-32 3.3.4 基因序列的短时傅里叶变换 32-34 3.3.5 串联重复序列拷贝的识别算法 34-37 3.4 本章小结 37-38 第4章 基于AR 模型的串联重复序列识别方法 38-50 4.1 引言 38 4.2 PSE 识别方法的思想及不足 38-40 4.2.1 PSE 识别方法的思想 38-39 4.2.2 PSE 识别串联重复序列的不足 39-40 4.3 基于AR 模型的谱估计方法 40-45 4.3.1 AR 模型 41-42 4.3.2 AR 模型阶次的确定 42-45 4.3.3 AR 模型参数估计 45 4.4 基于AR 模型的串联重复序列识别方法 45-48 4.4.1 方法的主要思想 45-46 4.4.2 方法的主要步骤 46-48 4.5 本章小结 48-50 第5章 实验与结果分析 50-62 5.1 仿真平台Matlab 简介 50 5.2 基于离散傅里叶变换的串联重复序列识别方法验证 50-56 5.2.1 实验环境 51 5.2.2 实验数据集 51 5.2.3 实验过程及分析 51-56 5.3 基于AR 模型的串联重复序列识别方法验证 56-61 5.3.1 实验环境 56-57 5.3.2 实验数据集 57 5.3.3 实验过程及分析 57-61 5.4 本章小结 61-62 结论 62-64 参考文献 64-69 攻读硕士学位期间承担的科研任务与主要成果 69-70 致谢 70-71 作者简介 71
|
相似论文
- 基于纹理特征的视频编码技术研究,TP391.41
- 慢性阻塞性肺病血液生化和免疫学指标的变化及其与DNA短串联重复序列的关联,R563.9
- 基于AR模型的机织物线状疵点的检测研究,TP391.41
- 水库多目标优化调度研究,TV697.1
- 基于FPGA+DSP的GPS数字中频信号源设计,TN741
- 螺杆空压机测试系统研究与实现,TH45
- 毫米波末制导雷达DBS成像技术研究,TJ761.14
- 建立LCM分离精子细胞的DNA检测方法及其法医学应用,D919
- 基于嵌入式系统的超声波气体泄漏检测仪的设计与研究,TP274.53
- GPS接收机单向授时算法研究,P228.4
- 青岛沿海绿潮藻类鉴定技术研究,Q949
- 上海地区小家鼠MUS MUSCULUS CASTANEUS群体遗传结构研究,Q953
- 船舶走航式波浪测量系统研究,U661.7
- 神经肌肉电刺激诱发的双相运动疲劳信息检测与处理技术研究,R87
- 河南汉族人群15个STR基因座遗传多态性及潮汕人的中原汉族起源,D919
- T波电交替和心率变异分析方法及其对恶性心律失常预测的探讨,R541.7
- 湖州市结核分枝杆菌基因分型特征研究,R52
- 应用STR多态性进行同胞鉴定4例,R394
- 改进型Sagnac光纤干涉仪定位信号识别与处理技术研究,TN929.11
- 中国居民消费价格指数波动的实证研究,F126
中图分类: > 生物科学 > 生物工程学(生物技术) > 仿生学 > 生物信息论
© 2012 www.xueweilunwen.com
|