学位论文 > 优秀研究生学位论文题录展示

统计流形框架下视觉特征的嵌入与目标识别

作 者: 邹健
导 师: 刘传才
学 校: 南京理工大学
专 业: 计算机应用技术
关键词: 图像视觉特征 统计流形 信息度量 流形学习 目标识别
分类号: TP391.41
类 型: 博士论文
年 份: 2012年
下 载: 124次
引 用: 0次
阅 读: 论文下载
 

内容摘要


颜色、纹理和形状是最基本的视觉特征,人们常用其来描述图像的属性,并广泛应用于目标识别任务。多尺度高斯导数滤波器和Gabor滤波器是构造图像局部形状和多谱纹理描述子的常用工具。在分析和应用时,通常将输入图像与一组高斯导数滤波器或Gabor滤波器的卷积输出作为多通道或多谱图像。这种多通道滤波图像与常见的彩色图像类似,具有局部多维和全局高维特性。全局方法习惯将所有通道逐像素点的滤波响应串联成一个高维向量。然而,在识别或学习等应用中,特征向量高维属性容易导致“维数灾难”,使得算法失效或输出次优结果。尽管下采样或其它压缩技术可以在一定程度上克服这些问题,但都是以丧失大量信息为代价。共生矩阵本质上是一种离散的概率分布,它利用像素特征空间上的共生信息描述图像纹理。传统方法常采用从共生矩阵中进一步提取Haralick特征,这时出现的问题是无法使用共生矩阵的全部统计信息。直方图是一种广泛使用的图像描述子,不过,目标图像与高斯导数或Gabor滤波器卷积生成的逐像素响应集大多呈现复杂的分布。在识别任务中如何从这些特征集中抽取判别直方图并赋予恰当的信息度量就显得十分重要。另外,直方图的非欧几何结构使得经典学习算法对其学习时难以得到令人满意的结果。针对上面提及的图像/滤波图像视觉特征用于识别和学习过程中所出现的问题,在统计流形框架下,本文考虑逐像素特征/共生特征的概率生成模型。通过使用模型离散化(仅针对非参数的概率模型)和紧致化嵌入技术,在(积)多项流形上借助(因子流形的)费舍尔-黎曼(Fisher-Riemannian)几何导出了生成模型间相似性度量。在此基础上,提出了基于特征/共生特征概率生成模型匹配的目标识别方法和基于随机直方图嵌入的统计流形学习方法。本篇论文的工作、主要成果和创新包括:(1)提出了基于特征/共生特征概率生成模型的目标表示。即利用目标图像/滤波图像上逐像素点的特征集的联合(或边际)生成模型,将目标表示成为某个(积)非参数统计流形上的点。利用图像/滤波图像上共生特征的生成模型,将目标表示成一个(积)多项流形上的点。这些目标表示方法是本文算法设计的基础。(2)理论上,证明了用多项流形的费舍尔几何来研究无限维非参数统计流形的某个子流形的合理性。应用上,给出了由非监督学习的分位点确定的模型离散化方法。为了获得与模型几何相适应的信息度量,采用了离散化模型的极大似然嵌入和嵌入的紧化技术。并对嵌入的(积)子流形赋予了由(因子)多项流形上测地距离导出的信息度量。由此,提出了基于特征概率生成模型匹配的目标识别方法。实验结果表明:当应用多通道Gabor特征或高斯微分特征进行目标识别时,该方法能在不同类型的目标库上获得较好的识别性能。(3)通过引入紧化的(积)共生矩阵嵌入,提出了在嵌入(积)子流形上匹配灰度/颜色共生矩阵的目标识别方法。为了将这种方法加以推广,本文设计了一种新颖的图像描述子—Gabor幅值共生矩阵。通过对多项流形上的测地距离度量的延拓,提出了匹配Gabor幅值共生矩阵的目标识别方法。实验结果验证:本文提出的识别方法在性能上明显优于经典(核)子空间方法和Haralick特征匹配的方法。(4)提出了基于随机直方图嵌入的统计流形学习方法。该方法不刻意追求从数据或特征集中抽取最优直方图,而是强调通过抽取多个低分辨率的随机直方图和紧致化嵌入,在积多项流形上对其判别信息加以整合。在嵌入积子流形上将经典流形学习算法和本征维数估计算法调整成与导出度量相适应的形式,由此实现积子流形的低维欧氏嵌入。实验结果证实,该方法在特征提取以及目标或数据集的可视化方面均有很好的表现。

全文目录


摘要  5-7
Abstract  7-13
1 绪论  13-30
  1.1 课题研究的意义及背景  13-16
  1.2 统计流形框架下目标识别研究现状  16-18
    1.2.1 国外的研究现状  16-17
    1.2.2 国内的研究现状  17-18
  1.3 图像的基本视觉特征  18-19
  1.4 参数和非参数统计流形信息几何的理论基础  19-27
    1.4.1 微分几何的基本概念  19-22
    1.4.2 参数统计流形的信息几何  22-25
    1.4.3 非参数统计流形的信息几何  25-27
  1.5 本文的研究内容  27-29
  1.6 本文的结构  29-30
2 几类多通道的图像视觉特征及其概率生成意义下的目标表示  30-43
  2.1 多尺度高斯微分特征及其概率生成意义下的目标表示  30-35
    2.1.1 多尺度空间方法概述  30-31
    2.1.2 高斯导数核及其性质  31-33
    2.1.3 基于多尺度高斯微分特征概率生成模型的目标表示  33-35
  2.2 多通道Gabor滤波响应及其概率生成意义下的目标表示  35-38
    2.2.1 Gabor滤波(小波、核、函数)  35-36
    2.2.2 基于多通道Gabor特征概率生成模型的目标表示  36-38
  2.3 基于全局颜色分布和共生颜色分布的目标表示  38-42
    2.3.1 基于全局颜色分布的目标表示  38-39
    2.3.2 基于共生颜色分布的目标表示  39-42
  2.4 本章小结  42-43
3 基于特征概率生成模型匹配的目标识别  43-59
  3.1 特征生成模型的离散化及紧致化嵌入  43-51
    3.1.1 生成建模及模型的离散化  43-44
    3.1.2 嵌入及经验分布序列的渐近性  44-48
    3.1.3 基于随机分位点的模型离散化  48-49
    3.1.4 紧致化及嵌入子流形上信息度量的构造  49-51
  3.2 积扩展  51-52
  3.3 实验结果及分析  52-58
    3.3.1 COIL-20库上的目标识别  52-56
    3.3.2 ZuBuD库上的建筑物识别  56-57
    3.3.3 FERET库上的人脸识别  57-58
  3.4 本章小结  58-59
4 基于共生特征生成模型匹配的目标识别  59-79
  4.1.颜色共生矩阵及其信息度量  59-67
  4.3 匹配共生Gabor幅值生成模型的目标识别  67-78
    4.3.1 幅值量化及分组方案  67-71
    4.3.2 基于Gabor幅值共生模型的多谱纹理表示  71-73
    4.3.3 实验结果及分析  73-78
  4.4 本章小结  78-79
5 基于随机直方图嵌入的统计流形学习  79-99
  5.1 流形学习研究背景及方法概述  79-81
  5.2 经典的非监督学习方法  81-87
    5.2.1 主成分分析  81-82
    5.2.2 多维尺度分析  82-83
    5.2.3 等距映射  83-84
    5.2.4 扩散映射  84-85
    5.2.5 局部线性嵌入  85-86
    5.2.6 拉普拉斯特征映射  86-87
  5.3 基于随机直方图嵌入的统计流形学习  87-92
    5.3.1 随机直方图嵌入  87-88
    5.3.2 信息度量的构造  88-89
    5.3.3 嵌入子流形的维数估计  89-91
    5.3.4 嵌入积子流形上的学习算法  91-92
  5.4 实验结果及分析  92-98
    5.4.1 Swiss Roll和Swiss Hole子流形的聚类及可视化  92-94
    5.4.2 ALOI子库中的图像目标的可视化及识别  94-98
  5.5 本章小结  98-99
6 总结与展望  99-101
  6.1 论文主要工作总结  99
  6.2 论文创新之处  99-100
  6.3 未来工作的展望  100-101
致谢  101-102
参考文献  102-110
附录  110-111
  A. 主持或参与的科研项目  110
  B. 攻读博士学位期间发表和录用的论文  110-111
  C. 在审稿件  111

相似论文

  1. 基于流形学习的高维流场数据分类研究,V231.3
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 红外超光谱图像的虚拟探测器研究,TP391.41
  4. 图像实时采集、存储与处理方法研究,TP391.41
  5. 唇读中的特征提取、选择与融合,TP391.41
  6. 空中目标抗干扰识别跟踪系统,TN215
  7. 基于流形学习的数据降维技术研究,TP311.13
  8. 红外图像目标识别及跟踪技术研究,TP391.41
  9. 水下目标特征的压缩与融合技术研究,TN911.7
  10. 基于判别型典型相关分析的多流形识别,TP391.41
  11. 基于局部优化投影的人脸识别方法研究,TP391.41
  12. 流形学习中样本点稀疏问题的研究,TP391.41
  13. 小型智能足球机器人系统全局视觉的研究与设计,TP242.6
  14. 鲁棒流形学习算法研究,TP391.41
  15. 基于流形学习的人脸识别算法研究,TP391.41
  16. 鉴别性流形学习在人脸识别中的研究应用,TP391.41
  17. SAR成像目标识别子区选取与匹配方法研究,TN957.52
  18. 视频目标检测与跟踪方法研究,TP391.41
  19. 基于学习的视频超分辨率重建算法研究及实现,TP391.41
  20. 基于数据降维的人脸图像检索及识别,TP391.41
  21. 基于图像特征的空间目标识别方法研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com