学位论文 > 优秀研究生学位论文题录展示

基于集成学习的支持向量机学习方法研究

作 者: 王敏
导 师: 王文剑
学 校: 山西大学
专 业: 计算机应用技术
关键词: 支持向量机 集成学习 特征选择 大规模数据 核选择
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 155次
引 用: 1次
阅 读: 论文下载
 

内容摘要


支持向量机Support Vector Machine, SVM)是机器学习领域的有效工具,以其快捷的训练方法和良好的泛化性能受到人们的广泛关注,在函数估计、模式识别等方面取得令人欣慰的成果。然而随着信息技术的飞速发展,机器学习所面临的数据维数及规模越来越大,使支持向量机的性能和效率受到影响。此外,支持向量机的性能易受核函数及参数的影响,因此寻找高效稳定的核选择方法一直也是支持向量机研究的热点问题。集成学习(Ensemble Learning)是一种典型的多机器学习方法,具有较强的稳定性和良好的泛化能力。针对以上问题,本文将SVM与集成学习技术有效融合,在以下几个方面开展研究工作。(1)对集成学习的基本原理及经典算法进行系统介绍,分析集成学习的特点及将其用于支持向量机研究的优势。(2)将多种特征选择算法与Bagging相结合提出一种基于集成学习的SVM特征选择算法。该算法先采用Bagging方法产生多组训练子集,然后在每一子集上利用不同的特征选择算法分别选出相应的特征子集作为输入空间训练得到子SVM学习器。利用不同的特征选择算法有利于构造有较大差异性在的集成个体,提高系统性能,从而弥补最优特征子集选取困难的不足。UCI数据集上的实验结果表明本文提出的算法与基于单种特征选择算法的集成学习相比能进一步增加个体差异性并提高系统学习性能。(3)将聚类与Bagging相结合提出一种基于集成学习的SVM大规模数据处理算法,其基本思想是从大规模数据集中提取出小规模的样本作为子训练集进行SVM集成个体的构造。为保证所提取的样本中包含较多的信息,算法先对原始数据聚类然后从每一类中选取一定比例的样本。在真实的空气质量预测数据集及标准数据集上的实验均说明本算法的有效性。(4)提出一种基于SVM集成的核选择算法。利用不同的核函数及参数产生SVM集成个体,将核选择融合于集成学习当中,避免了传统支持向量机在处理实际问题中要先进行核选择的难题。本文利用集成学习对SVM的特征选择、大规模数据处理、核选择等三方面内容进行研究。本文取得的成果是对SVM学习方法研究的一种补充,也为SVM解决实际应用问题提供一种新模式。

全文目录


中文摘要  8-10
ABSTRACT  10-12
第一章 引言  12-16
  1.1 研究背景  12-13
  1.2 国内外研究现状  13-14
  1.3 论文的内容与结构  14-16
第二章 预备知识  16-22
  2.1 支持向量机  16-18
  2.2 集成学习  18-21
  2.3 本章小结  21-22
第三章 基于Bagging算法改进的支持向量机学习方法  22-34
  3.1 基于特征选择的SVM Bagging算法  22-29
    3.1.1 MFS_Bagging算法  22-24
    3.1.2 基于特征选择集成学习的差异度度量  24-25
    3.1.3 实验结果与分析  25-29
  3.2 面向大规模数据的SVM Bagging算法  29-32
    3.2.1 C_Bagging算法  30-31
    3.2.2 实验结果与分析  31-32
  3.3 本章小结  32-34
第四章 基于SVM集成的核选择方法  34-40
  4.1 基于SVM集成的核选择算法  34-36
  4.2 实验结果与分析  36-38
  4.3 本章小结  38-40
第五章 结论与展望  40-42
参考文献  42-46
攻读学位期间取得的研究成果  46-48
致谢  48-50
个人简况  50-54

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于仿生模式识别的文本分类技术研究,TP391.1
  10. 唇读中的特征提取、选择与融合,TP391.41
  11. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 基于支持向量机的故障诊断方法研究,TP18
  14. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  15. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  16. 语音情感识别的特征选择与特征产生,TP18
  17. 基于车载3D加速传感器的路况监测研究,TP274
  18. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  19. 基于数据分布特征的文本分类研究,TP391.1
  20. 基于机器学习的入侵检测系统研究,TP393.08
  21. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com