学位论文 > 优秀研究生学位论文题录展示

关于基因微阵列数据中癌症差异基因表达的若干算法研究

作 者: 涂华伟
导 师: 梁艳春
学 校: 吉林大学
专 业: 计算机应用技术
关键词: 生物信息学 癌症 基因微阵列技术 改变点 COPA 差异表达基因
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 105次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在高等生物个体发育中,不同组织细胞在不同时期的基因表达按照时间和空间顺序有序地进行,称之为基因的差异表达。差异表达的基因可能直接或间接关系到癌症的发生和易感性。检测这些差异表达基因的重要意义在于能够从基因层次揭示癌症的发生机理并且能够更好地探索癌症治疗的方法。DNA微阵列技术是随着基因组测序技术的发展而逐步发展起来,它为检测差异表达基因提供了丰富的数据信息和强大的工具,是癌症分析的重要手段。本文的主要工作是基于2005年Science发表的一篇论文:首次在常见上皮细胞固态肿瘤中发现非随机复发基因融合位点。这一现象引发了一种新型的差异表达基因的检测问题,即对于特定基因,其癌症样本相对于正常样本并不是全部都过表达的。传统的差异基因检测方法对于这种情况的检测效果不是很理想,因此本文在基于COPA系列的统计方法(COPA, OS, ORT, MOST)上提出了基于三均值的MOST算法改进——TMOST算法,在基于改变点分析的统计方法(LRS)上提出了基于分布变点检测的T统计算法——CPT算法。将各种算法处理生成的模拟数据并将结果进行ROC曲线和FDR曲线分析,得到TMOST算法与CPT算法都有较高的灵敏度、特异度和较低的错误发现率。对乳腺癌微阵列数据进行处理,COPA, OS, ORT, MOST, TMOST, LRS, CPT算法在其降序排列后的前25个检测结果中,分别可以发现与乳腺癌有关的基因个数为:6, 6, 6, 4, 7, 9, 9。由此可以得出结论,TMOST算法与CPT算法具有比较优秀的检测能力。

全文目录


提要  4-7
第1章 绪论  7-12
  1.1 研究背景  7-10
    1.1.1 基因芯片技术介绍  8
    1.1.2 基因芯片技术在癌症诊断上的应用  8-9
    1.1.3 差异表达基因检测的研究现状  9-10
  1.2 本文工作  10-12
第2章 差异表达基因的相关知识  12-15
  2.1 差异表达基因的检测方法  12-15
    2.1.1 倍数法  13
    2.1.2 t 检验  13
    2.1.3 贝叶斯统计  13-14
    2.1.4 SAM  14-15
第3章 基于特定差异表达方式的算法研究  15-24
  3.1 一种特定差异表达方式的介绍  15-16
  3.2 基于COPA 系列的算法研究  16-19
    3.2.1 COPA 系列算法介绍  16-18
    3.2.2 基于TMOST 的差异表达基因检测算法  18-19
  3.3 基于改变点的算法研究  19-24
    3.3.1 改变点问题的研究介绍  19-20
    3.3.2 基于改变点的算法在差异表达基因检测的应用  20-21
    3.3.3 基于CPT 的差异表达基因检测算法  21-24
第4章 算法实现及实验结果分析  24-39
  4.1 R 语言和 Bioconductor 介绍  24-26
  4.2 模拟实验结果分析  26-34
    4.2.1 TMOST 算法的实验结果分析  26-31
    4.2.2 CPT 算法的实验结果分析  31-34
  4.3 真实数据实验结果与分析  34-39
    4.3.1 基因表达数据预处理  34-36
    4.3.2 实验结果  36-39
第5章 总结和展望  39-41
  5.1 工作总结  39-40
  5.2 工作展望  40-41
参考文献  41-44
致谢  44-45
摘要  45-48
Abstract  48-50

相似论文

  1. BioLab面向生物计算服务的网格系统,TP399-C8
  2. 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
  3. 基于表面增强拉曼光谱技术的鼻咽癌与胃癌检测方法研究,R739.63
  4. 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
  5. 4-氨基-2-三氟甲基苯基维甲酸酯的制备和质量控制的初步研究,TQ463
  6. 红曲霉洛伐他汀生物合成相关基因克隆与分析,TQ927
  7. 八种昆虫转录组数据中OBP、CSP和RyR基因预测及序列分析,S433
  8. 高温胁迫条件下紫花苜蓿抑制消减cDNA文库的构建与初步分析,S541.9
  9. 棉纤维起始发育优势基因表达谱和三个新基因的克隆与功能初步分析,S562
  10. 猪链球菌2型感染小鼠腹腔巨噬细胞基因表达谱差异分析,S858.91
  11. 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
  12. 两个玉米转录因子ZmC4HC3和ZmNAC的克隆与表达分析,S513
  13. 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
  14. 斯氏按蚊感染约氏疟原虫后24小时差异表达基因的筛选与分析,R531.3
  15. 利谷隆致胚胎期SD大鼠睾丸发育整体基因表达水平的研究,Q75
  16. 家蚕HSP基因的表达调控研究,S881.2
  17. 电离辐射诱发microRNA表达改变及其对辐射损伤调控机制,R144
  18. 高剂量维生素C杀死肾癌细胞相关机理研究,R737.11
  19. GeneFishing技术解析华南忍冬高钙环境下基因表达的差异,S567.79
  20. 上海近郊某地区犬Torque Teno virus感染率调查及全基因组序列分析,S858.292
  21. 机械通气所致急性肺损伤对大鼠昼夜节律改变和肺组织基因表达的影响,R563.8

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com