学位论文 > 优秀研究生学位论文题录展示

半监督降维和分类算法研究

作 者: 赵玲玲
导 师: 周水生
学 校: 西安电子科技大学
专 业: 应用数学
关键词: 半监督学习 维数约减 集成学习
分类号: TP181
类 型: 硕士论文
年 份: 2009年
下 载: 72次
引 用: 3次
阅 读: 论文下载
 

内容摘要


在很多实际应用中,随着数据采集技术和存储技术的发展,获取大量的无标号样本已变得非常容易,而获取有标号样本通常需要付出很大的代价。因而,相对于大量的无标号样本,有标号样本通常会很少。传统的无监督学习只能利用无标号样本进行学习,监督学习只利用少量的有标号样本学习,而半监督学习则能同时利用大量的无标号样本和少量的有标号样本来进行学习,因此,半监督学习是非常有意义的研究课题。半监督学习包括半监督分类、半监督回归、半监督聚类和半监督维数约减等几个方面。本文以半监督学习为基础,主要做了以下一些工作:在半监督维数约减方面,提出了一种新的算法ISSDR。一方面,它能够充分利用正负约束信息,使得在低维空间中不属于同一类的数据离的越远越好,而属于同一类的数据靠的越近越好。另一方面,引入剩余的大量未标记数据,利用隐藏在未标记数据中的潜在信息,能很好的保持数据集的全局以及局部结构。实验结果表明,该算法能从大量的未标记数据以及有限的成对约束中学习出有用的知识,实验证明了该算法的有效性。在半监督分类方面,提出了一种新的集成算法E-LNP。它选用一种基于图的半监督学习算法LNP作为子学习器,通过选择不同的特征个数以及学习参数,利用子学习器分别多次训练进行预测,然后将其预测结果按投票方式进行集成,从而得到最终的学习结果。实验表明E-LNP算法比仅使用单一的半监督分类器有更强的泛化能力,能有效的提高分类精度。

全文目录


摘要  3-4
Abstract  4-7
第一章 绪论  7-13
  1.1 机器学习  7-8
  1.2 半监督学习的研究背景及内容  8-10
  1.3 国内外对半监督学习研究的进展及现状  10-11
  1.4 论文的研究内容及安排  11-13
第二章 半监督学习理论  13-27
  2.1 半监督学习的基础知识  13-15
    2.1.1 半监督学习的有效性  13-14
    2.1.2 半监督学习的两个基本假设  14-15
  2.2 几种已有分类算法的半监督学习框架  15-18
    2.2.1 基于SVM 的半监督学习  15-16
    2.2.2 基于核方法的半监督学习  16-17
    2.2.3 基于K 均值的半监督学习  17-18
  2.3 四类半监督学习算法  18-25
    2.3.1 基于EM 的半监督学习算法  19-21
    2.3.2 增量半监督学习算法  21-22
    2.3.3 基于图的半监督学习算法  22-23
    2.3.4 直推式支持向量机  23-25
  2.4 本章小结  25-27
第三章 维数约减算法  27-39
  3.1 无监督维数约减算法  27-30
    3.1.1 主成份分析PCA  27-28
    3.1.2 局部线性嵌入LLE  28-30
  3.2 监督维数约减算法  30-32
    3.2.1 线性判别分析LDA  30-31
    3.2.2 有监督的局部线性嵌入SLLE  31-32
  3.3 半监督维数约减算法  32-35
    3.3.1 半监督典型相关分析Semi-CCA  32-34
    3.3.2 半监督维数约减SSDR  34-35
  3.4 改进的半监督维数约减算法  35-38
    3.4.1 ISSDR 算法介绍  35-36
    3.4.2 实验分析  36-38
  3.5 本章小结  38-39
第四章 基于集成学习的半监督学习算法  39-51
  4.1 集成学习  39-43
    4.1.1 集成学习的理论基础  39-40
    4.1.2 个体生成方法  40-42
    4.1.3 结论生成方法  42-43
  4.2 线性邻域传播算法LNP  43-46
    4.2.1 LNP 算法描述  43-45
    4.2.2 LNP 算法分析  45-46
  4.3 集成算法在半监督学习中的应用  46-50
    4.3.1 算法描述  46-48
    4.3.2 实验分析  48-50
  4.4 本章小结  50-51
结束语  51-53
致谢  53-55
参考文献  55-61
在读期间的研究成果  61-62

相似论文

  1. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  2. 基于半监督哈希算法的图像检索方法研究,TP391.41
  3. 基于半监督学习的时间序列分类研究与实现,TP181
  4. 数据挖掘在研究生调剂中的应用研究,TP311.13
  5. 基于集成学习的垃圾短信多级分类技术研究,TN929.53
  6. 基于专家委员会的主动学习算法研究,TP181
  7. 半监督学习中协同训练与多视图方法的比较及改进,TP18
  8. 集成学习及其应用研究,TP181
  9. 基于粒子群优化算法的支持向量机集成学习方法研究,TP181
  10. 基于多任务的多层次选择性集成学习的研究,TP181
  11. 基于半监督SVM的入侵检测研究,TP393.08
  12. 面向金融问答的论坛观点挖掘,TP391.3
  13. 基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
  14. 基于支持向量机的水电故障分类器的设计与实现,TV738
  15. 半监督学习若干问题的研究,TP181
  16. 决策森林的子空间选择和集成优化,TP181
  17. 基于半监督分类的入侵检测系统模型研究,TP393.08
  18. 基于少量标记数据约束聚类算法的入侵检测技术研究,TP393.08
  19. 基于半监督学习的中文问句分类研究,TP391.1
  20. 基于半监督学习的图像分割系统的设计与实现,TP391.41
  21. 基于嵌入空间的降维算法建模研究及应用,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com