学位论文 > 优秀研究生学位论文题录展示
一种用于学习非平衡数据支持向量机的改进
作 者: 蒋莎
导 师: 张晓龙
学 校: 武汉科技大学
专 业: 计算机应用技术
关键词: 支持向量机 非平衡数据 评价函数 学习参数优化
分类号: TP18
类 型: 硕士论文
年 份: 2008年
下 载: 216次
引 用: 5次
阅 读: 论文下载
内容摘要
支持向量机(Support Vector Machine, SVM)是由Vapnik等人于上世纪90年代提出的一种崭新的学习机器,它作为统计学习理论的实现方法,是处理小样本学习的有效工具,在模式识别、信号处理、自动化、通讯等领域得到了广泛应用。在不平衡样本集中,不同类别的样本数量上的差异导致分类器性能的下降,所以一直以来不平衡样本集都是机器学习的一个研究热点。在不平衡样本集中寻找SVM的最优参数(又称模型选择)也是SVM研究领域的一个重要分支。实际应用中,分类数据往往是非平衡数据,少数类别的数据可能有很大的分类代价。分类性能不仅要考虑分类精度,同时要考虑分类代价。本文主要研究了非平衡SVM中参数的优化选取问题。SVM在各行各业中的应用已经取得了良好的效果,SVM的参数选取是SVM研究中的重要问题,参数选取的不同,对SVM的泛化性能影响很大。非平衡SVM的参数优化选取的研究较少,本文针对非平衡问题,建立了参数选取的模型,设计了算法,并进行了相关实验。本文扩展了SVM学习方法,对于以高斯核为核函数时的少数类和多数类使用不同的惩罚参数C+、C-以获得高敏感度的超平面,利用遗传算法对SVM的学习参数进行优化调整。同时,通过改进评价函数,对分类结果的质量进行评价。实验结果表明,算法对于非平衡数据的分类有较好分类结果,对少数类样本预测的准确性较高。
|
全文目录
摘要 4-5 Abstract 5-8 第一章 绪论 8-12 1.1 研究背景 8-9 1.2 非平衡数据分类的困难 9-10 1.3 非平衡数据分类以及SVM 的研究现状 10 1.4 本文的主要工作 10-12 第二章 支持向量机(SVM)理论 12-22 2.1 机器学习问题 12-13 2.1.1 问题的表示 12-13 2.1.2 经验风险最小化 13 2.2 统计学习理论 13-16 2.2.1 学习过程的一致性条件 14 2.2.2 VC 维 14-15 2.2.3 推广性的界 15 2.2.4 结构风险最小化 15-16 2.3 支持向量机 16-20 2.3.1 最优超平面 16-17 2.3.2 支持向量机分类器 17-19 2.3.3 核函数 19-20 2.4 SVM 的特点 20-21 2.5 本章小结 21-22 第三章 非平衡数据支持向量机分类算法 22-26 3.1 传统分类器的设计局限性 22 3.2 非平衡支持向量机的性能分析 22-23 3.3 非平衡数据问题的分类应对措施 23-24 3.4 F-MEASURE 评价函数 24-25 3.4.1 非平衡支持向量机的原模型 24 3.4.2 F-measure 24-25 3.5 本章小结 25-26 第四章 支持向量机的参数选择 26-41 4.1 支持向量机模型选择的意义及方法 26-27 4.1.1 模型选择的意义 26 4.1.2 模型选择方法简介 26-27 4.2 核函数及其参数选择 27-31 4.2.1 核函数的选择 27-30 4.2.2 核参数的调整 30-31 4.3 误差惩罚参数 C 31 4.4 基于遗传算法的支持向量机模型选择 31-40 4.4.1 遗传算法的基本思想 31-32 4.4.2 遗传算法的基本流程 32-33 4.4.3 染色体编码 33-35 4.4.4 适应度函数 35-36 4.4.5 遗传操作 36-40 4.5 本章小结 40-41 第五章 一种用于非平衡数据的SVM 学习算法 41-46 5.1 一种新的非平衡数据分类性能评价函数 41-42 5.2 对于非平衡数据的学习参数优化 42-45 5.2.1 学习参数优化 42-43 5.2.2 基于遗传算法的用于非平衡数据SVM 学习参数优化 43-45 5.3 小结 45-46 第六章 实验与性能说明 46-50 6.1 实验平台以及数据集 46 6.2 实验数据 46-48 6.3 总结 48-50 第七章 总结 50-51 参考文献 51-54 附录A 攻读学位其间发表的论文 54-55 致谢 55
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|