学位论文 > 优秀研究生学位论文题录展示

基于改进的非负稀疏编码图像分类研究

作 者: 李钱钱
导 师: 曹国
学 校: 南京理工大学
专 业: 模式识别与智能系统
关键词: 图像分类 词袋模型 空间金字塔匹配模型 稀疏编码 非负稀疏编码 拉普拉斯非负稀疏编码 超图拉普拉斯稀疏编码
分类号: TP391.41
类 型: 硕士论文
年 份: 2014年
下 载: 21次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网技术的快速发展,图像正以惊人的速度增长,如何将海量的图像数据根据图像的内容分成不同的类别是一个比较重要并富有意义的工作,图像分类技术正是在此基础上提出并发展而来。图像分类是机器学习和计算机视觉领域的一个基础的应用方向。词袋模型和空间金字塔匹配模型已经被普遍的应用在图像分类领域并取得了较好的效果。在基于词袋模型和空间金字塔匹配模型的图像分类过程中,视觉词典生成是一个重要的过程。原始的词袋模型和空间金字塔匹配模型通常使用K-means方法生成视觉词典。然而由于K-means聚类方法对于初始中心过于敏感,不易得到全局最优解等缺点严重影响了视觉词典的生成。稀疏编码作为一种神经网络方法,其已经成功的应用到图像分类领域中,并取得了较高的图像分类精度。本文的主要工作及成果如下:(1)实现了基于稀疏编码的图像分类方法。考虑到非负稀疏编码方法的优点,本文将非负稀疏编码应用到图像分类领域,同样取得了较好的分类效果。(2)提出了基于拉普拉斯非负稀疏编码的图像分类方法。拉普拉斯非负稀疏编码能够同时编码各部分特征,同时也能更好的模拟哺乳动物初级视觉系统主视皮层V1区简单细胞感受野的行为,相对于非负稀疏编码图像分类方法,本方法应用在图像分类中取得了更高的分类精度。(3)提出了基于超图的拉普拉斯非负稀疏编码的图像分类方法。基于超图的拉普拉斯非负稀疏编码方法将超图与拉普拉斯非负稀疏编码相结合,能保持构成超边的各部分特征的相似性,从而具有更好的编码能力,和其他已经存在的图像分类方法相比,本方法取得的分类效果更好。

全文目录


摘要  3-4
Abstract  4-5
目录  5-7
1 绪论  7-12
  1.1 图像分类背景概述  7
  1.2 图像分类的应用  7-8
  1.3 图像分类国内外研究现状  8-9
  1.4 本文主要工作概述  9-11
  1.5 本文的内容章节安排  11-12
2 稀疏编码非负稀疏编码算法及其在图像分类方面的应用  12-29
  2.1 图像分类中常用的BoW模型和SPM模型  12-22
    2.1.1 SIFT特征提取算法  12-17
    2.1.2 生成视觉词典  17-18
    2.1.3 训练分类器  18-22
  2.2 稀疏编码理论  22-25
  2.3 非负稀疏编码理论  25-27
  2.4 基于稀疏编码和非负稀疏编码的图像分类  27-28
  2.5 本章小结  28-29
3 拉普拉斯非负稀疏编码  29-37
  3.1 局部保持投影  29-30
    3.1.1 局部保持投影原理  29
    3.1.2 局部保持投影算法  29-30
  3.2 拉普拉斯矩阵的构造  30-32
    3.2.1 传统的相似性度量方法  30-31
    3.2.2 基于直方图的相似性矩阵的构造  31-32
  3.3 拉普拉斯非负稀疏编码算法  32-36
  3.4 本章小结  36-37
4 超图拉普拉斯非负稀疏编码  37-41
  4.1 超图  37-38
    4.1.1 超图相关概念  38
  4.2 超图拉普拉斯非负稀疏编码理论  38-39
  4.3 超图拉普拉斯非负稀疏编码和拉普拉斯非负稀疏编码的关系  39
  4.4 超边的构造  39
  4.5 本章小结  39-41
5 实验结果与分析  41-51
  5.1 算法复杂度分析  41
  5.2 实验参数设置  41-42
  5.3 CALTECH-101图像数据库  42-44
    5.3.1 Caltech-101图像数据库介绍  42-43
    5.3.2 Caltech-101图像数据库实验结果与分析  43-44
  5.4 SCENE-15图像数据库  44-46
    5.4.1 Scene-15图像数据库  44-45
    5.4.2 Scene-15图像数据库实验结果与分析  45-46
  5.5 CALTECH-256图像数据库  46-48
    5.5.1 Caltech-256图像数据库  46-47
    5.5.2 Caltech-256图像数据库实验结果与分析  47-48
  5.6 UIUC-SPORT图像数据库  48-50
    5.6.1 UIUC-Sport图像数据库  48
    5.6.2 UIUC-Sport图像数据库实验结果与分析  48-50
  5.7 本章小结  50-51
6 总结与展望  51-53
  6.1 总结  51
  6.2 展望  51-53
致谢  53-54
参考文献  54-59
附录  59

相似论文

  1. 图像的稀疏表示及编码模型研究,TP391.41
  2. 基于“词袋”模型的图像分类系统,TP391.41
  3. 基于纹理特征的图像分类研究,TP391.41
  4. 极化SAR图像精细地物分类方法研究与实现,TN957.52
  5. 复杂场景中的时空特征学习与人体行为分析,TP391.41
  6. 面向图像表达的非负局部坐标分解算法,TP391.41
  7. 支持向量机遥感图像分类的研究,P237
  8. 基于量子进化RBF网络的图像识别,TP391.41
  9. 遥感图像区域多中心分类方法适用性分析,P237
  10. 利用融合方法的遥感图像分类研究,TP751
  11. 基于复杂网络的数据挖掘分类问题研究与应用,N941.4
  12. 基于遥感图像的土地利用信息自动提取研究,P237
  13. 快速主动禁忌搜索及其在图像分类中的应用,TP391.41
  14. 自适应量子行为粒子群算法及其在图像分类中的应用研究,TP391.41
  15. 基于稀疏性理论的人脸识别方法研究,TP391.41
  16. 基于分形理论的遥感图像分类方法研究,TP751
  17. 基于纹理的遥感图像分类算法及其应用研究,TP751
  18. 基于综合特征的图像语义分类技术的研究,TP391.41
  19. 图像检索中的相关反馈和分类算法研究,TP391.41
  20. 仿射传播聚类在遥感图像分类中的应用研究,P237
  21. 遥感影像分类方法比较研究,P237

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com