学位论文 > 优秀研究生学位论文题录展示

图像检索方法研究

作 者: 何昌钦
导 师: 郭禾
学 校: 大连理工大学
专 业: 计算机应用技术
关键词: 空间PACT 潜在阶梯边缘模板 词袋模型 空间可视化词典库 Digikam
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 152次
引 用: 3次
阅 读: 论文下载
 

内容摘要


随着多媒体技术及Internet网络的迅速发展,图像信息资源的检索已成为国内外研究的热点。建立有效的图像描述和检索机制已成为迫切需要解决的问题。而图像检索最重要的问题就是解决对图像语义的理解。空间PACT是一种用来进行场景实例和类别识别的新型特征表示,它在PACT(Census变换直方图的主成分分析)的基础上结合最新的场景语义识别框架:空间金字塔,使之相比现存算法具有更高的识别率。词袋模型原本是用在信息检索中,它将一个文本看作是一个高频词的集合,文本中的每个词出现都是独立的,不依赖于其他词是否出现。可视化词典库模型首先采用不同的特征描述符对图像集进行特征提取,然后过对这些特征进行聚类,得到“可视化词典库”,在根据这个“可视化词典库”得到图像的可视化词袋表示,作为图像检索中的特征表示。针对场景语义识别的强度和效率,本文提出一种新型的识别方法,在空间PACT中引入潜在阶梯边缘模板,在几乎不影响识别率的基础上改进算法效率。同时通过引入颜色特征信息,获得具有更强语义识别能力的特征表示。试验结果表明,该算法具有计算效率高,识别率高,强语义识别的特点。针对可视化词袋模型,本文在考虑空间相似度的基础上,提出一种称为空间可视化词典库的图像检索方法。首先对图像集进行空间划分,得到空间子区域集合。然后在每一个对应空间子区域上求出空间可视化词典库。把每一个空间子区域所对应的空间词袋表示串联起来就得到了图像的全局可视化词袋表示。本文提出的方法是一种普遍性框架,适用于多种特征描述符。通过在不同数据库上的实验证明了,本文方法相对于经典的可视化词典库模型,具有明显的识别率提升。Digikam是一个高级图像管理应用程序,它提供了方便的接口来实现对数字图像的导入和管理,并且可以通过图像的关键字、描述、标题、日期等信息对图像进行检索,因此通过在Digikam引入特征描述符可以构建功能强大的图像检索系统。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-17
  1.1 研究背景  9-11
  1.2 国内外研究现状  11-15
  1.3 本文所做的工作  15-16
  1.4 论文的组织结构  16-17
2 基于空间PACT和颜色特征的场景语义识别  17-36
  2.1 空间PACT  18-23
    2.1.1 PACT:中心变换直方图的主成分分析  18-20
    2.1.2 PACT编码形状  20-22
    2.1.3 空间PACT  22-23
  2.2 基于潜在边缘的空间PACT  23-27
    2.2.1 数字图像与边缘检测  23-26
    2.2.2 潜在边缘模板  26-27
  2.3 颜色特征提取与表达  27-30
    2.3.1 RGB直方图  27-28
    2.3.2 HSV色彩通道直方图  28-29
    2.3.3 HSV色彩通道颜色矩  29
    2.3.4 颜色聚合向量  29-30
  2.4 空间PACT和颜色特征场景强语义识别  30-31
    2.4.1 语义特征  30-31
    2.4.2 语义相似性度量  31
  2.5 相关实验  31-36
3 基于空间可视化词典库模型的图像分类  36-50
  3.1 空间可视化词典  36-40
    3.1.1 空间相似度  36-37
    3.1.2 空间聚类  37-38
    3.1.3 空间可视化词典库构建  38-40
  3.2 图像的全局特征表示  40-41
  3.3 SVM支持向量机分类  41-43
  3.4 图像间的相似度度量  43-44
  3.5 特征提取  44-47
    3.5.1 V1滤波器  44-46
    3.5.2 PACT  46-47
  3.6 实验结果  47-50
    3.6.1 场景类别识别  47-48
    3.6.2 Caltech-101  48-50
4 检索系统设计  50-54
  4.1 检索系统组成结构  50-51
  4.2 Digikam  51-52
  4.3 基于Digikam的检索系统  52-54
结论  54-56
参考文献  56-58
攻读硕士学位期间发表学术论文情况  58-59
致谢  59-61

相似论文

  1. 基于“词袋”模型的图像分类系统,TP391.41
  2. 基于空间邻域词袋模型的图像标注技术,TP391.41
  3. 基于草图的图像检索技术研究与系统实现,TP391.41
  4. 基于显著度抠像的图像检索研究与实现,TP391.41
  5. 基于广义组合多核高斯函数的图像分类方法研究,TP391.41
  6. 基于多标签学习的图像区域语义自动标注算法研究,TP391.41
  7. 基于音频词袋和MPEG-7特征的暴力视频快速分类算法研究,TP391.41
  8. 基于快速鲁棒性特征的物体识别检测算法研究,TP391.41
  9. 基于时空特征和词袋模型的多模态视频内容识别算法研究,TP391.41
  10. 图像识别中图像表达的关键技术研究,TP391.41
  11. 新闻视频故事单元关联分析技术研究,TP391.41
  12. 基于场景外观建模的移动机器人视觉闭环检测研究,TP242
  13. 基于视频的人脸表情识别,TP391.41
  14. 基于兴趣点和形状特征的动作识别,TP391.41
  15. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  16. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  17. 基于FPGA的高速图像预处理技术的研究,TP391.41
  18. 2D人脸模板保护算法研究,TP391.41
  19. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  20. 图像拼接技术研究,TP391.41
  21. 高效精确字符串匹配算法的研究与实现,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com