学位论文 > 优秀研究生学位论文题录展示

一种用于学习非平衡数据支持向量机的改进

作 者: 蒋莎
导 师: 张晓龙
学 校: 武汉科技大学
专 业: 计算机应用技术
关键词: 支持向量机 非平衡数据 评价函数 学习参数优化
分类号: TP18
类 型: 硕士论文
年 份: 2008年
下 载: 216次
引 用: 5次
阅 读: 论文下载
 

内容摘要


支持向量机(Support Vector Machine, SVM)是由Vapnik等人于上世纪90年代提出的一种崭新的学习机器,它作为统计学习理论的实现方法,是处理小样本学习的有效工具,在模式识别、信号处理、自动化、通讯等领域得到了广泛应用。在不平衡样本集中,不同类别的样本数量上的差异导致分类器性能的下降,所以一直以来不平衡样本集都是机器学习的一个研究热点。在不平衡样本集中寻找SVM的最优参数(又称模型选择)也是SVM研究领域的一个重要分支。实际应用中,分类数据往往是非平衡数据,少数类别的数据可能有很大的分类代价。分类性能不仅要考虑分类精度,同时要考虑分类代价。本文主要研究了非平衡SVM中参数的优化选取问题。SVM在各行各业中的应用已经取得了良好的效果,SVM的参数选取是SVM研究中的重要问题,参数选取的不同,对SVM的泛化性能影响很大。非平衡SVM的参数优化选取的研究较少,本文针对非平衡问题,建立了参数选取的模型,设计了算法,并进行了相关实验。本文扩展了SVM学习方法,对于以高斯核为核函数时的少数类和多数类使用不同的惩罚参数C+、C-以获得高敏感度的超平面,利用遗传算法对SVM的学习参数进行优化调整。同时,通过改进评价函数,对分类结果的质量进行评价。实验结果表明,算法对于非平衡数据的分类有较好分类结果,对少数类样本预测的准确性较高。

全文目录


摘要  4-5
Abstract  5-8
第一章 绪论  8-12
  1.1 研究背景  8-9
  1.2 非平衡数据分类的困难  9-10
  1.3 非平衡数据分类以及SVM 的研究现状  10
  1.4 本文的主要工作  10-12
第二章 支持向量机(SVM)理论  12-22
  2.1 机器学习问题  12-13
    2.1.1 问题的表示  12-13
    2.1.2 经验风险最小化  13
  2.2 统计学习理论  13-16
    2.2.1 学习过程的一致性条件  14
    2.2.2 VC 维  14-15
    2.2.3 推广性的界  15
    2.2.4 结构风险最小化  15-16
  2.3 支持向量机  16-20
    2.3.1 最优超平面  16-17
    2.3.2 支持向量机分类器  17-19
    2.3.3 核函数  19-20
  2.4 SVM 的特点  20-21
  2.5 本章小结  21-22
第三章 非平衡数据支持向量机分类算法  22-26
  3.1 传统分类器的设计局限性  22
  3.2 非平衡支持向量机的性能分析  22-23
  3.3 非平衡数据问题的分类应对措施  23-24
  3.4 F-MEASURE 评价函数  24-25
    3.4.1 非平衡支持向量机的原模型  24
    3.4.2 F-measure  24-25
  3.5 本章小结  25-26
第四章 支持向量机的参数选择  26-41
  4.1 支持向量机模型选择的意义及方法  26-27
    4.1.1 模型选择的意义  26
    4.1.2 模型选择方法简介  26-27
  4.2 核函数及其参数选择  27-31
    4.2.1 核函数的选择  27-30
    4.2.2 核参数的调整  30-31
  4.3 误差惩罚参数 C  31
  4.4 基于遗传算法的支持向量机模型选择  31-40
    4.4.1 遗传算法的基本思想  31-32
    4.4.2 遗传算法的基本流程  32-33
    4.4.3 染色体编码  33-35
    4.4.4 适应度函数  35-36
    4.4.5 遗传操作  36-40
  4.5 本章小结  40-41
第五章 一种用于非平衡数据的SVM 学习算法  41-46
  5.1 一种新的非平衡数据分类性能评价函数  41-42
  5.2 对于非平衡数据的学习参数优化  42-45
    5.2.1 学习参数优化  42-43
    5.2.2 基于遗传算法的用于非平衡数据SVM 学习参数优化  43-45
  5.3 小结  45-46
第六章 实验与性能说明  46-50
  6.1 实验平台以及数据集  46
  6.2 实验数据  46-48
  6.3 总结  48-50
第七章 总结  50-51
参考文献  51-54
附录A 攻读学位其间发表的论文  54-55
致谢  55

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 基于机器学习的入侵检测系统研究,TP393.08
  17. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  18. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  19. 基于AdaBoost算法的人脸识别研究,TP391.41
  20. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  21. 城市污水处理厂中A~2O工艺过程的建模研究,X703

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com