学位论文 > 优秀研究生学位论文题录展示

降维方法对基因表达数据分类效果的优化研究

作 者: 李左凌
导 师: 翁桂荣
学 校: 苏州大学
专 业: 精密仪器及机械
关键词: DNA微阵列 基因表达数据 数据降维 支持向量机
分类号: Q75
类 型: 硕士论文
年 份: 2012年
下 载: 47次
引 用: 0次
阅 读: 论文下载
 

内容摘要


DNA微阵列的提出对生物学和医学产生了革命性的影响。通过运用微阵列技术,生物学家可以大规模提取DNA和RNA信息,进而得到包含成千上万基因的表达数据——基因表达数据,这些数据中蕴含了能够揭开生命奥秘的大量信息。如何从海量数据中提取有效的信息已经成为DNA微阵列研究的重点内容。由于基因表达数据具有高维、小样本和非线性等特点,因此降低数据维数并且选择一种适用于非线性小样本数据集的机器学习方法成为提高基因表达数据挖掘成功率的关键。为了克服基因表达数据维数高、样本少、非线性的特点,本文将降维方法应用到基因表达数据上,并选择支持向量机(Support Vector Machine,SVM)对降维后的数据进行分类,有效地提高了分类的准确率。支持向量机基于统计学习理论,采用了结构风险最小化原则,能够在一定程度上克服小样本学习问题的困难,其核函数思想将非线性空间的问题转换到线性空间,极大地降低了算法的复杂度。本文的研究将侧重于不同降维方法对于提高数据分类准确率的效果。选择GCM和Lymphoma两个著名的数据集,分别使用PCA、MDS等不同方法降维后再采用支持向量机分类,对比实验结果后表明,降维不仅有助于提高分类准确率,而且相较传统的分析方法具备一定优势。

全文目录


相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 不匹配信道下耳语音说话人识别研究,TN912.34
  17. 基于文本挖掘的学者简历自动生成,TP391.1
  18. 基于特征选择的入侵检测研究,TP393.08
  19. 基于SVM的跨膜蛋白结构预测应用研究,Q51
  20. LS-SVM算法预测煤层瓦斯涌出量技术研究及应用,TD712.5
  21. 基于支持向量机的故障诊断研究,TH165.3

中图分类: > 生物科学 > 分子生物学 > 分子遗传学
© 2012 www.xueweilunwen.com