学位论文 > 优秀研究生学位论文题录展示

基于图的标志SNP位点选择算法研究

作 者: 陈娟
导 师: 郭茂祖
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: TagSNP位点选择 基于图的算法 最大密度子图 精确度预测
分类号: Q78
类 型: 硕士论文
年 份: 2008年
下 载: 162次
引 用: 0次
阅 读: 论文下载
 

内容摘要


单核苷酸多态性(Single Nucleotide Polymorphism,SNP)是指在基因组水平上由单个核苷酸变异所引起的DNA序列的多态性。在各类单体型中,少部分SNP位点包含绝大部分的遗传变异信息,这些位点称为标志SNP位点(TagSNP或htSNP)。通过生物实验从基因型序列中获取确定的单体型序列,即单体分型(Haplotyping)可以得到比较精确、可靠的结果。然而,代价高昂,难以满足当前海量生物数据分析。因此,借助数学和计算机结合的计算分子生物学手段寻找TagSNP位点,是解决单体分型问题的一个有效途径。本文对TagSNP位点选择问题进行了详细的阐述,并在充分研究和分析当前SNP位点选择算法的基础上,创新性地提出了基于图的TagSNP位点选择算法MDStagger,有效的提高了预测精确度,缩短了算法的运行时间。具体地,本文的主要研究内容和创新点如下:第一,描述了TagSNP位点的选择问题,包括解决该问题的数学模型和算法思想。同时,本文还分析了这些算法的优缺点及各自适用的范围。第二,提出了基于图的TagSNP位点选择算法MDStagger。文中阐述了图模型的构建法则以及将SNP位点的信息转化为最大密度子图的思想。重点描述了通过最大密度子图来寻找TagSNP位点的思想。实验表明,该算法能够避免因为随机算法带来的局部最优问题和枚举法产生的高时间复杂度等问题,与当前主要的TagSNP位点选择算法相比较,具有较优性能。第三,提出了一种改进的精确度预测方法,该方法基于多TagSNP位点联合预测非TagSNP位点。实验表明,多TagSNP位点联合预测比单一TagSNP位点预测,能够得到更高的精确度。该预测方法不仅提高了精确度,同时也为SNP位点评价准则的改进以及缺失位点的预测指明了一个新的方向。第四,实现了TagSNP位点选择算法及其精确度预测系统。该系统使用了文中提出的基于图的选择算法。该系统的数据预处理模块也适用于其它TagSNP位点选择算法的前期数据处理。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-17
  1.1 课题背景  8-10
    1.1.1 TagSNP位点选择的意义  8-10
    1.1.2 课题来源  10
  1.2 国内外研究现状  10-15
    1.2.1 问题的数学描述  11-12
    1.2.2 基于LD的方法  12-14
    1.2.3 基于block的方法  14
    1.2.4 基于预测精度的方法  14-15
  1.3 本文的主要研究内容  15-16
  1.4 本文的组织结构  16-17
第2章 基于图的TagSNP位点选择方法  17-28
  2.1 引言  17
  2.2 数据预处理  17-21
    2.2.1 删除冗余SNP位点  18-19
    2.2.2 SNP位点聚类  19-21
  2.3 基于图的TagSNP位点选择  21-26
    2.3.1 图模型的构建  23-24
    2.3.2 TagSNP位点选择  24-26
  2.4 本章小结  26-28
第3章 精确度预测方法的研究  28-39
  3.1 引言  28
  3.2 算法评价准则  28-30
  3.3 实验结果与分析  30-34
    3.3.1 不同数据集的实验对比  30-31
    3.3.2 相同数据集的实验对比  31-34
  3.4 精确度预测方法的改进  34-38
    3.4.1 多TagSNP联合预测精确度  34-36
    3.4.2 精确度预测方法改进前后的实验对比  36-38
  3.5 本章小结  38-39
第4章 系统平台  39-49
  4.1 引言  39
  4.2 系统实现所用技术  39
  4.3 系统功能模块  39-43
    4.3.1 删除冗余SNP位点模块  39-40
    4.3.2 聚类模块  40-41
    4.3.3 TagSNP位点选择模块  41-42
    4.3.4 精确度预测模块  42-43
    4.3.5 系统功能模块小结  43
  4.4 数据处理流程  43-48
  4.5 本章小结  48-49
结论  49-51
参考文献  51-55
攻读学位期间发表的学术论文  55-57
致谢  57

相似论文

  1. 基于子图密度的序列模体发现算法研究,TP301.6
  2. 基于三阶马尔科夫模型和最大流的模体识别算法,TP301.6
  3. 汉语语义依存分析研究,TP391.1
  4. 基因调控网络模型描述语言研究,Q78
  5. 多转录因子组合调控研究,Q78
  6. Let-7 microRNA在小鼠胎肺发育时期的表达检测及其腺病毒穿梭质粒的构建,Q78
  7. hBMP4和hBMP7在中国仓鼠卵巢细胞中的表达研究,Q78
  8. 易错PCR定向进化扩展青霉FS1884脂肪酶,Q78
  9. 蛋白磷酸酶2A Cα亚基敲除所致心脏能量代谢重塑的研究,Q78
  10. 昆虫OBP CSP和sid-1基因的预测及序列分析,Q78
  11. Thermobifida Halotolerans YIM 90462~T木聚糖酶基因克隆表达以及酶学特性研究,Q78
  12. 携带人白细胞介素10转基因小鼠的初步研究,Q78
  13. miR-23在小鼠骨骼肌中的表达及其对骨骼肌再生调节作用的初步研究,Q78
  14. 人乳铁蛋白表达载体的构建及转基因阳性细胞株的建立,Q78
  15. 海藻糖改善枯草芽孢杆菌电转化方法的研究,Q78
  16. 腐生葡萄球菌M36耐有机溶剂脂肪酶基因的克隆与表达,Q78
  17. Aspergillus niger Z-25葡萄糖氧化酶基因在毕赤酵母中的表达,Q78
  18. 人源β-防御素-6的原核表达及纯化,Q78
  19. 圆眼珍珠蛙(Lepidobatrachus laevis)皮肤cDNA文库的构建、筛选及胰蛋白酶抑制剂的原核表达和活性研究,Q78
  20. 酿酒酵母代谢木糖工程菌的构建,Q78

中图分类: > 生物科学 > 分子生物学 > 基因工程(遗传工程)
© 2012 www.xueweilunwen.com