学位论文 > 优秀研究生学位论文题录展示

惩罚COX模型和弹性网技术在高维数据生存分析中的应用

作 者: 闫丽娜
导 师: 王彤
学 校: 山西医科大学
专 业: 流行病与卫生统计学
关键词: 高维生物数据 生存分析 L2-COX模型 L1-COX模型 EN-COX模型
分类号: R73-31
类 型: 硕士论文
年 份: 2011年
下 载: 23次
引 用: 0次
阅 读: 论文下载
 

内容摘要


目的:利用DNA微阵列技术和蛋白质谱技术测出的基因或蛋白等高维生物数据对癌症病人进行生存预测已不能再利用传统Cox比例风险模型。本论文将探讨惩罚COX模型(包括L2惩罚COX模型和L1惩罚COX模型)和弹性网技术(Elastic Net)用于高维数据生存分析的优劣,从而揭露死亡或其他结局发生的时间和生物数据之间的关系,为得到更精确的诊断及预后从而改进治疗提供合理的方法依据。方法:介绍惩罚COX模型(包括L2惩罚COX模型和L1惩罚COX模型)和弹性网技术(Elastic Net)的基本原理。针对基因或蛋白生物信息数据的高维度、强相关、小样本的特点进行模拟研究,对Van’t Veer等学者乳腺癌研究数据集进行分析,考察这些模型的预测性能。采用R软件进行数据模拟及分析。结果:以R 2作为模型预测性能的评价标准,从模拟实验中我们得出各自变量相关程度一样时随着数据资料方差的增大,各种模型筛选出的自变量倾向于增多,模型评价指标结果R2也呈增大趋势,模型拟合也越好。且随着删失比例的增加,几种方法的预测效能都会降低,说明模型的预测能力会受到删失比例的影响。结论:L2-COX模型和L1-COX模型都是处理高维生存资料的方法,只是L2-COX模型没有降维作用,但是处理共线性的效能强。L1-COX模型主要用来对高维数据进行降维而处理共线性的功能稍弱。EN-COX模型同时汲取了L1和L2两种模型的优点,既能有效处理共线性又可以降维还同时改进了L1,是分析处理高维小样本生存资料的理想模型。

全文目录


摘要  5-6
Abstract  6-7
前言  7-10
第一章 惩罚COX 模型和弹性网  10-28
  1.1 基因表达数据的cox 比例风险回归模型:  10
  1.2 L2 惩罚cox 模型  10-15
    1.2.1 岭回归的基本思想及原理  10-12
    1.2.2 L2 惩罚cox 模型  12
    1.2.3 调整参数λ的选择  12-13
    1.2.4 岭回归的算法  13-15
  1.3 L1 惩罚cox 模型  15-20
    1.3.1 LASSO 的基本思想及原理  15-16
    1.3.2 算法  16-18
    1.3.3 调整参数λ 的选择  18-19
    1.3.4 LASSO 的优势和局限性  19-20
  1.4 弹性网  20-26
    1.4.1 弹性网的基本思想  20-21
    1.4.2 NEN 模型修正为 EN 模型  21-23
    1.4.3 COX 背景下的 EN 模型  23-24
    1.4.4 弹性网的计算方法  24-25
    1.4.5 调整参数的选择  25-26
    1.4.6 弹性网的优势  26
  1.5 模型评价  26-28
第二章 模拟研究及实例分析  28-40
  2.1 模拟研究  28-34
    2.1.1 模拟数据生成  28-29
    2.1.2 模拟数据分析  29
    2.1.3 模拟数据分析结果  29-33
    2.1.4 模拟结果分析  33-34
  2.2 实例分析  34-38
  2.3 小结  38-40
第三章 讨论  40-42
参考文献  42-45
个人简历  45-46
致谢  46

相似论文

  1. 中亚热带两种常绿阔叶林群落细根寿命估计,S718.5
  2. 基于生存分析方法的房地产上市公司财务风险评价研究,F224
  3. CTGF基因在食管癌中的表达及与患者预后关系的研究,R735.1
  4. Caspase-8表达与食管癌关系的研究,R735.1
  5. 乌兰布和沙漠天然梭梭种群特征分析,S718.5
  6. 原发性肝癌420例综合治疗分析,R735.7
  7. 亚热带杉木人工林细根寿命研究,S718.5
  8. COX-2在乳腺癌组织中的表达与临床病理意义及其预后生存分析,R737.9
  9. 复发脑胶质瘤的临床预后相关因素分析与治疗探讨,R739.41
  10. 腹腔镜与开腹肝癌切除术临床对比研究,R735.7
  11. 萧山区结直肠癌患者生存影响因素和预后分析,R735.3
  12. 上市公司财务危机预警分析,F275
  13. 国家助学贷款资产证券化研究,F832.4;G647.5
  14. 有监督的主成分分析及偏Cox回归模型在基因数据生存预测中的应用,R195
  15. 定制肿瘤型假体置换术后假体生存及并发症的发生和原因分析,R687.3
  16. 河南省林州市人群食管癌、胃癌现时生存率分析,R735
  17. 基于生存分析的上市公司财务风险预警研究,F224
  18. 结直肠癌病人血清中CEA、CA19-9、LN与预后关系的研究,R735.3
  19. 肝硬化食管静脉曲张出血硬化治疗与生存分析,R571.3
  20. 影响肾细胞癌患者预后的因素分析,R737.11

中图分类: > 医药、卫生 > 肿瘤学 > 肿瘤学实验研究 > 肿瘤学调查与统计
© 2012 www.xueweilunwen.com