学位论文 > 优秀研究生学位论文题录展示
划分分类模型中主动学习关键技术研究
作 者: 高文涛
导 师: 胡正平
学 校: 燕山大学
专 业: 通信与信息系统
关键词: 分类模型 主动学习 样本选择 支持向量机 不确定样本 代表性样本
分类号: TP181
类 型: 硕士论文
年 份: 2010年
下 载: 110次
引 用: 0次
阅 读: 论文下载
内容摘要
在机器学习中,主动学习可以避免分类模型被动地接受样本信息,有选择地从未标注样本集中选取信息量最大的样本进行专家标注,然后通过对较少的大信息量样本进行学习,得到代价小、性能高的分类器。随着获得的未标注样本数据越来越多,人工标注的代价较高并且难度较大,因此,需要对选择标注的样本数量严格控制。本文针对主动学习采样过程中存在的问题,在借鉴国内外最新思路的基础上,研究改进了一些主动学习和样本选择算法。首先,在充分考虑样本不确定性置信度模型和样本代表性置信度模型的基础之上,讨论了基于样本不确定性和代表性相结合的可控主动学习算法,通过设置合适的分类正确率变化参数,实现主动学习选择样本数量的可调控制。其次,在基于原型的主动学习基础上,为解决样本不确定性置信度模型和样本代表性置信度模型在结合方式上缺乏适应性的问题,引入偏倚赖权值系数函数,研究了基于不同样本属性综合的鲁棒偏倚赖主动学习算法。该算法利用偏倚赖权值系数函数充分挖掘不同样本属性,突出样本特性,解决针对不同样本两个模型不能够自适应协调的问题。最后,为有效进行大训练样本集的约减,使分类模型学习代价减小,实现了基于改进加权压缩近邻与最近边界规则SVM样本约减选择算法,该算法利用减法聚类消除算法初值敏感问题,利用随机小样本池技术加快算法进程,去除了训练集中的冗余。
|
全文目录
摘要 5-6 ABSTRACT 6-11 第1章 绪论 11-18 1.1 课题背景及意义 11-12 1.2 国内外研究现状 12-16 1.2.1 主动学习研究现状 12-15 1.2.2 样本选择研究现状 15-16 1.3 论文的研究内容和组织结构 16-18 第2章 主动学习与样本选择基本原理 18-31 2.1 SVM 学习模型 18-22 2.1.1 线性可分情况 18-20 2.1.2 线性不可分情况 20-21 2.1.3 主动学习的SVM 21-22 2.2 主动学习基本原理 22-28 2.2.1 主动学习基本概念 22-23 2.2.2 主动学习不确定度缩减算法 23-26 2.2.3 主动学习未来泛化错误率缩减算法 26 2.2.4 主动学习版本空间缩减算法 26-27 2.2.5 其它主动学习算法 27-28 2.3 样本选择基本原理 28-29 2.4 本章小结 29-31 第3章 基于样本不确定性和代表性相结合的可控主动学习 31-42 3.1 引言 31-32 3.2 系统框图 32-33 3.3 样本KNN 分布不确定性置信度模型 33-35 3.4 样本先验分布代表性置信度模型 35-36 3.5 样本不确定性和代表性相结合的可控主动学习 36-37 3.6 实验结果 37-41 3.7 本章小结 41-42 第4章 基于不同样本属性综合的鲁棒偏倚赖主动学习 42-54 4.1 引言 42-43 4.2 基于不同样本属性综合的鲁棒偏倚赖主动学习 43-48 4.2.1 系统组成 43-45 4.2.2 初始分类器模型构建 45 4.2.3 渐变的样本代表性置信度模型 45-46 4.2.4 基于信息熵的样本不确定性置信度模型 46-47 4.2.5 鲁棒偏倚赖主动学习 47-48 4.3 实验结果 48-53 4.4 本章小结 53-54 第5章 基于改进加权压缩近邻与最近边界规则SVM 样本约减选择 54-64 5.1 引言 54-55 5.2 基于改进加权压缩近邻与最近边界规则SVM 样本约减选择 55-59 5.2.1 系统组成 55-56 5.2.2 基于改进加权压缩近邻的样本选择 56-58 5.2.3 基于随机小样本池最近边界规则的样本选择 58-59 5.3 实验结果 59-62 5.4 本章小结 62-64 结论 64-66 参考文献 66-72 攻读硕士学位期间承担的科研任务与主要成果 72-73 致谢 73-74 作者简介 74
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|