学位论文 > 优秀研究生学位论文题录展示

面向语义的图像检索关键技术研究

作 者: 贺广南
导 师: 杨育彬
学 校: 南京大学
专 业: 计算机应用技术
关键词: 图像检索 图像语义分类 流形学习 码书模型 视觉一致性
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 77次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着图像数字化技术的发展,尤其是互联网技术的快速发展和普及应用,人们在各个专业领域和日常生活中所接触到的图像数量已经达到海量化的规模,其内容也更加呈现多样化,这对有效地管理这些图像媒体提出了迫切的应用需求,对图像进行基于语义内容的检索也因此成为持续受到关注的研究热点。数字图像在计算机中的存储形式是像素矩阵,而人类所观察的图像信息则不仅仅是像素,还包含着人类自身的主观感受。这种主观感受和人类自身的经验知识密切相关。人类通过自己的主观加工获取图像的语义内容,因此计算机所能提取和表示的图像视觉特征往往不能很好的描述该图像所代表的高层语义,这造成了图像检索中的“语义鸿沟”问题。研究者针对“语义鸿沟”问题,进行了大量研究,提出了不少的解决方法,但仍未能很好地克服该难题。本论文从三个方向入手,尝试对“语义鸿沟”问题提供进一步的解决方案。首先,在图像检索的前期处理阶段,使用一种新的图像分割算法来获取图像的高层语义特征,对其进行有针对性的量化后再用于后续的检索过程。检索实验表明,该分割算法能够在一定程度上获取图像的语义特性。其次,在图像检索的相关反馈过程中,引入半监督学习算法,对被检索图像的语义进行较准确的学习。在流形学习算法框架基础上,提出了一种新的关系图增强算法用于半监督的流形学习,从而实现了一种语义流形学习算法,在图像检索和反馈图像检索中都获得了较好的实验效果。最后,对图像的语义分类进行了研究,图像语义分类可直接应用于图像检索过程中。在码书模型的基础上提出了一种基于差异最大化的新型编码方法,改进了现有的码书模型。通过大量的图像语义分类实验验证了所提码书模型方法的有效性。

全文目录


摘要  3-4
Abstract  4-10
第一章 绪论  10-16
  1.1 研究背景  10
  1.2 研究问题及现状  10-13
  1.3 论文内容与贡献  13-14
  1.4 论文的组织结构  14-16
第二章 基于视觉一致性图像检索  16-27
  2.1 引言  16-17
  2.2 基于视觉一致性的图像分割  17-19
  2.3 视觉一致性区域定义及特征描述  19-22
  2.4 图像检索实验  22-26
  2.5 本章小结  26-27
第三章 图像语义子流形学习算法  27-40
  3.1 引言  27
  3.2 图像检索中的流形学习  27-29
  3.3 图嵌入的数据降维  29-33
    3.3.1 问题描述  29-30
    3.3.2 ARE(Augmented Relation Embedding)  30-31
    3.3.3 MMP(Maximize Margin Projection)  31-32
    3.3.4 SDA(Semi-supervised Discriminate Analysis)  32-33
  3.4 关系图增强算法  33-35
    3.4.1 建立分级的关系矩阵  34-35
    3.4.2 ESDA和目标函数的求解  35
  3.5 实验部分  35-39
    3.5.1 实验设置  35-36
    3.5.2 图像检索实验  36-37
    3.5.3 图像相关反馈实验  37-39
  3.6 本章小结  39-40
第四章 基于差异最大化编码的码书模型  40-58
  4.1 引言  40-42
  4.2 基于码书模型的图像分类技术  42-45
    4.2.1 码书的创建  42
    4.2.2 图像特征的编码  42-44
    4.2.3 分类器的学习  44-45
  4.3 差异最大化编码方法  45-48
    4.3.1 问题描述  45
    4.3.2 差异最大化编码  45-48
  4.4 图像语义分类实验部分  48-57
    4.4.1 实验设置  48-50
    4.4.2 实验一:15个场景类  50-52
    4.4.3 实验二:8个运动场景类  52-54
    4.4.4 实验三和实验四:Caltech-101和Caltech-256  54-57
  4.5 本章小结  57-58
第五章 总结与展望  58-61
  5.1 总结  58-59
  5.2 展望  59-61
参考文献  61-68
攻读硕士学位期间发表论文及参加科研项目情况  68-69
致谢  69-70

相似论文

  1. 基于流形学习的高维流场数据分类研究,V231.3
  2. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  3. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 基于内容的服装图像检索技术研究及实现,TP391.41
  6. 基于多示例学习的用户关注概念区域发现,TP391.41
  7. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  8. 唇读中的特征提取、选择与融合,TP391.41
  9. 多样性密度学习算法的研究与应用,TP181
  10. 基于流形学习的数据降维技术研究,TP311.13
  11. 基于形状的汉画像检索技术研究,TP391.41
  12. 大规模图像检索中局部特征聚合与索引方法研究,TP391.3
  13. 基于学习的视频超分辨率重建算法研究及实现,TP391.41
  14. 基于Jade的多Agent图像检索系统,TP391.3
  15. 基于脑电的情感识别,TP391.4
  16. 基于内容的大规模数字图像检索技术研究,TP391.41
  17. 图像检索的并行计算方法与系统,TP391.3
  18. 基于脑波的情感图像检索的研究,TP391.41
  19. 综合多特征的图像检索技术研究,TP391.41
  20. 基于草图的图像检索技术研究与系统实现,TP391.41
  21. 基于半监督哈希算法的图像检索方法研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com