学位论文 > 优秀研究生学位论文题录展示

基于流形学习的数据降维技术研究

作 者: 胡鹏
导 师: 杨安平
学 校: 长沙理工大学
专 业: 交通信息工程及控制
关键词: 流形学习 线性降维 非线性降维 图嵌入 局部线性嵌入 几何摄动 最大线性块
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 16次
引 用: 0次
阅 读: 论文下载
 

内容摘要


自然界中的数据大都以高维非结构化的形式存在,信息化技术的高速发展使得获取这些数据成为了可能。高维数据不仅难以被人们直观理解,也难以被现有机器学习和数据挖掘算法有效处理。降维操作已经成为处理这些数据的一个重要手段,经过几十年的发展,降维技术已经取得了长足的进步,出现了如PCA、LDA等一系列经典方法,但在当下的线性与非线性降维领域仍然存在许多具有挑战性的问题。21世纪的头十年里,以ISOMAP、LLE为代表的流形降维方法突发猛进,成为了当下最为热门方向之一。论文从广义流形学习定义出发,围绕线性流形与非线性流形降维算法展开,从全局线性流形降维、全局非线性流形降维、局部非线性流形降维对流形学习算法进行了一些研究,主要工作有:针对线性判别分析在实际识别任务中计算消耗大、内存需求多,易出现“小样本问题”的缺点,将传统线性判别分析的方法放到图嵌入的框架下进行分析,结合正则化技术,设计了一种图嵌入正则化的线性判别分析方法。首先构造了非监督最优类可分准则,通过图嵌入理论得出一种求解该判别准则下最优投影向量的方法,最后将求解传统LDA中投影向量的复杂特征值分解过程转化成为一个简单的特征值分解和一个正则化拟合问题。针对局部线性嵌入算法对近邻点个数的选择依赖性较强,不适应处理稀疏数据源的缺点,提出了一种基于几何距离摄动的局部线性嵌入算法。从几何直观的角度,提出了一种根据几何摄动值来判定流形结构上的两个点是否处于同一线性平面的方法,根据这一方法,提出了一种基于几何摄动的分块算法,将原始流形数据划分为一组最大线性分块的组合;在进行局部嵌入的过程中通过线性块内的点来确定局部线性嵌入算法中近邻点的选择范围,从而保证局部线性嵌入算法局部线性特性这一假设条件得到满足。

全文目录


摘要  5-6ABSTRACT  6-10第一章 绪论  10-16  1.1 研究背景  10-12  1.2 研究意义和应用情况  12-13  1.3 本文的实验平台及实验用数据简介  13-14  1.4 论文的组织架构  14-16第二章 流形学习降维算法介绍  16-30  2.1 流形学习的数学含义  16  2.2 流形学习方法的分类  16-17  2.3 线性流形降维典型方法  17-19    2.3.1 PCA  17-18    2.3.2 经典多维尺度分析  18    2.3.3 Fisher 线性判别分析  18-19  2.4 非线性流形降维方法  19-26    2.4.1 核主成分分析  20-21    2.4.2 等距映射算法  21-22    2.4.3 局部线性嵌入算法  22-23    2.4.4 Laplacian 特征映射算法  23-24    2.4.5 Hessian 特征映射  24-26  2.5 局部切空间排列  26-27  2.6 流形学习算法小结  27-30第三章 一种图嵌入正则化的线性判别分析方法  30-40  3.1 引言  30-31  3.2 正则化线性判别分析 RLDA  31-32  3.3 图嵌入正则化判别分析  32-37    3.3.1 谱图理论  32-33    3.3.2 图嵌入线性判别分析  33-34    3.3.3 正则化最小二乘拟合  34-35    3.3.4 图嵌入正则化人脸判别分析  35-36    3.3.5 算法计算复杂度分析  36-37  3.4 实验  37-39  3.5 本章小结  39-40第四章 基于几何距离摄动的局部线性嵌入算法  40-49  4.1 局部线性嵌入LLE  40-42  4.2 基于几何摄动的 LLE 算法  42-46    4.2.1 非线性度与几何距离摄动  43-44    4.2.2 基于几何摄动的最大线性块  44-45    4.2.3 最大线性分块算法  45    4.2.4 最大线性分块下的局部嵌入算法  45-46  4.3 实验  46-48    4.3.1 人造数据集上降维实验  46-47    4.3.2 UCI 数据上分类实验  47-48  4.4 本章小结  48-49第五章 总结与展望  49-51参考文献  51-56致谢  56-57附录(攻读硕士学位期间发表录用论文)  57-58中英文摘要  58-66

相似论文

  1. 基于流形学习的高维流场数据分类研究,V231.3
  2. 唇读中的特征提取、选择与融合,TP391.41
  3. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  4. 基于学习的视频超分辨率重建算法研究及实现,TP391.41
  5. 基于脑电的情感识别,TP391.4
  6. 基于稀疏表达的人脸识别算法研究,TP391.41
  7. 人体运动时间序列可视化及多索引方法研究,TP391.41
  8. 基于多基点定位的ISOMAP算法改进研究,TP181
  9. 暴雨中冰雹的识别,P429
  10. 流形学习中的增量谱嵌入方法,TP181
  11. 基于局部线性嵌入的高维数据降维研究,O186.12
  12. 流形学习算法及其在图像识别中的应用研究,TP391.41
  13. 流形学习中非线性降维方法的研究及在烟草数据中的应用,TP181
  14. 基于稀疏表示的降维算法研究,TP391.41
  15. 视频数据特征降维及其在篡改检测中的应用,TP391.41
  16. 针对非线性系统的降维策略研究与仿真,TP11
  17. 基于小样本的线性降维算法与应用研究,TP391.41
  18. 基于谱回归的人脸识别的研究,TP391.41
  19. 基因微阵列特征选择与分类方法研究,TN492
  20. 结果分级的快速子序列相似查询方法研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com