学位论文 > 优秀研究生学位论文题录展示

基于中层特征表示的图像分类研究

作 者: 赵悦
导 师: 于剑
学 校: 北京交通大学
专 业: 计算机科学与技术
关键词: 词袋模型 视觉词 视觉短语 局部二值模式
分类号: TP391.41
类 型: 硕士论文
年 份: 2014年
下 载: 43次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网技术的高速发展,网络中积累了大量的数字图像和视频数据,这些数据为人们的使用带来了新的技术挑战。为此,许多专家学者对图像分类、图像检索、目标识别等领域进行了相关研究,而图像特征提取是这些研究的基础工作。图像特征提取是将图像映射到特征集合的过程,针对图像特征提取,目前已经提出了许多优秀的算法,这些算法可以根据语义表达能力的不同进行分类。其中,基于中层语义的特征表示因其性能较好而成为人们关注的研究对象。本文对典型的底层特征表示和中层特征表示进行了分析和改进,并通过图像分类实验对性能进行了验证,具体工作如下:第一,提出了一种基于词袋模型(BoW)的图像空间语义中层特征方法。由于BoW及其改进方法假设视觉词间相互独立,而这种假设忽视了视觉词间的关联性,所以本文提出了结合空间语义信息的图像特征表示方法。该方法通过计算图像中视觉词间的分布距离提取相似的视觉词,组成视觉短语,融入图像的全局空间信息;同时,在这些视觉短语中提取具有语义代表性的视觉短语,建立短语词典来加入图像的语义信息。结合视觉词间的这两种信息,构成新的图像空间语义特征。在UIUC-Sports8图像库和Scene-15图像库进行图像分类实验,实验结果表明这种结合空间语义信息的特征具有更好的分类准确率。第二,对局部二值模式(LBP)进行改进:1)提出了一种基于LBP的纹理短语特征方法;2)提出了一种基于BoWL的图像空间语义特征方法。实验表明,这两种方法都取得了较好的图像分类效果。最后,针对当前网络图像特征方法的实际情况,以及LBP的简单性和较好的表达力,本文还研究了LBP对实际网络图像分类的作用,通过实验结果可以看出该方法能够有效地对网络文字图像进行表示。

全文目录


致谢  5-6
摘要  6-7
ABSTRACT  7-10
1. 引言  10-14
  1.1 研究背景  10
  1.2 课题研究意义  10-11
  1.3 国内外发展现状  11-13
    1.3.1 特征方法发展现状  11-12
    1.3.2 场景图像分类发展现状  12-13
  1.4 论文主要工作  13-14
2 图像底层特征表示方法  14-28
  2.1 颜色特征提取  14-15
  2.2 灰度直方图  15-16
  2.3 纹理特征提取  16-18
  2.4 尺度不变性特征  18-28
    2.4.1 图像尺度空间  18-19
    2.4.2 图像金字塔  19-21
    2.4.3 尺度不变性特征变换(SIFT)  21-28
3 图像中层特征表示方法  28-36
  3.1 图像语义信息  28-30
    3.1.1 图像语义的概念  28
    3.1.2 语义鸿沟  28-29
    3.1.3 图像语义的层次  29-30
  3.2 词袋模型BoW  30-32
  3.3 基于BoW的LDA分类  32-33
  3.4 基于BoW的空间金字塔  33-36
4 结合空间语义信息的图像特征  36-49
  4.1 改进的中层语义特征  36-41
    4.1.1 空间信息方法  37-39
    4.1.2 语义信息方法  39-41
  4.2 结合空间语义信息的视觉词短语方法  41-47
    4.2.1 底层特征提取  41-42
    4.2.2 提取视觉词对  42-45
    4.2.3 计算短语词典  45-46
    4.2.4 形成短语特征  46-47
  4.3 图像分类器  47-49
5 图像分类实验  49-54
  5.1 UIUC-Sports8图像库  49-51
  5.2 Scene-15图像库  51-54
6 基于纹理的中层特征研究  54-68
  6.1 纹理特征的发展  54-55
  6.2 改进LBP特征方法  55-61
    6.2.1 传统LBP特征  56-59
    6.2.2 多尺度LBP金字塔  59-60
    6.2.3 基于LBP的词袋模型  60-61
  6.3 基于LBP的空间语义特征  61-68
    6.3.1 基于LBP的纹理短语特征  62-64
    6.3.2 基于BoWL的空间语义特征  64-65
    6.3.3 基于LBP的网络图像分类  65-68
7 结束语  68-69
参考文献  69-74
作者简历  74-76
学位论文数据集  76

相似论文

  1. 基于“词袋”模型的图像分类系统,TP391.41
  2. 基于特征描述的图像匹配方法研究,TP391.41
  3. 基于流形学习的人脸识别算法研究,TP391.41
  4. 基于时空关键点的动作识别算法研究,TP391.41
  5. 基于空间邻域词袋模型的图像标注技术,TP391.41
  6. 基于SIFT的视觉跟踪算法研究,TP391.41
  7. 基于特征融合的人脸识别算法研究,TP391.41
  8. 局部描述特征结合概率潜在语义模型的场景分类技术研究,TP391.41
  9. 新闻视频故事单元关联分析技术研究,TP391.41
  10. 基于显著区域的图像语义分类方法研究,TP391.41
  11. sIB算法在图像无监督分类中的应用研究,TP391.41
  12. 基于新型局部二值模式的视频分割方法研究,TP391.41
  13. 基于中层语义的图像场景分类算法研究,TP391.41
  14. 视觉对象分类:多核多示例学习,TP391.41
  15. 基于兴趣点和形状特征的动作识别,TP391.41
  16. 基于EMD的虹膜识别方法研究,TP391.41
  17. 基于视频的远距离人脸检测与识别,TP391.41
  18. 基于局部特征分析的人脸表情识别问题研究,TP391.41
  19. 大规模图像搜索中的图像表示模型,TP391.41
  20. 基于语义主题模型的图像场景分类研究,TP391.41
  21. 基于场景外观建模的移动机器人视觉闭环检测研究,TP242

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com