学位论文 > 优秀研究生学位论文题录展示

近似重复图像检测及其应用

作 者: 李先斌
导 师: 俞能海
学 校: 中国科学技术大学
专 业: 信号与信息处理
关键词: 图像检测 图像检索 标注信息 基于内容 文本 自动标注 数据集 语义鸿沟 数字图像 边缘特征 颜色直方图 预定义 纹理特征 索引方法 视觉信息 色矩 医学图像 视觉特征 检测算法 标签集
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 143次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着多媒体技术和互联网技术的快速发展,互联网上的图像数量呈爆炸式增长。同文字信息相比,基于视觉的图像更加生动、易于理解,这种优势使得数字图像的应用范围非常广泛,比如医学图像、新闻图像、商业图像等等。在数字图像带给我们信息传播的便利的同时,我们也面临着一个越来越严峻的问题,如何在浩如烟海的互联网图像中寻找我们所需要的图像,而解决这个问题的关键技术就是图像检索。传统的图像检索研究分为基于文本基于内容两个方面。由于基于文本的图像检索方法可以利用已经比较成熟的文本检索方法,以及查询时的简单快捷等特性,目前,这种方式依然是主流的图像检索方式,应用非常广泛。基于文本的检索方式依赖于图像的标注信息,但是图像的标注信息存在理解不一致及图像标注很难获取等问题,于是促进了基于内容的图像检索的研究的发展。在这种检索方式中,图像并不是使用文本,而是使用图像本身的视觉信息来表示的。比较成熟的方式是根据图像本身的内容提取出各种视觉特征,例如颜色直方图、颜色矩、纹理特征边缘特征等等。然后由于语义鸿沟、维数灾难等问题的存在,以及在短暂的未来这些问题无法很好解决,基于内容的图像检索发函遇到了瓶颈。然而,基于内容的图像检索的一个分支,近似重复图像检测,由于其问题的特征性及对问题良好的定义,现在得到了广泛的关注和研究。本论文尝试研究近似重复图像检测的关键问题,并着重研究了距离函数选择问题和图像的有效索引问题。另外,根据近似重复图像的特征,我们设计了一个系统可以对图像自动添加情感标注词。本文的主要成果和创新包括下面几个部分:1.提出了一种新的距离函数来进行近似重复图像的检测。不同于以往距离函数单一的度量标准,我们在这里采用了新提出的曼哈顿相关距离(MR距离),这种距离度量函数克服了单一使用曼哈顿距离或LRCA距离的缺陷,可以更全面的反映图像之间的真实距离,适用于真实复杂的数据集。另外,针对大规模数据集问题,我们将MR距离同LSH结合起来,使之可以在大规模数据集上工作,从而在近似重复图像检测中表现出更好的性能。实验结果证明,我们新提出的近似重复图像检测算法使搜索准确率明显提升。2.设计了一个基于近似重复图片检测的情感标签图像自动标注算法,可以为图像自动添加人们忽视的情感标签。与大部分图像自动标注算法不同,该算法不依赖于预定义标签集合,而是从图像及其近似重复图像的评论性文本中抽取情感词,然后根据情感词的情感得分及正负极性选取人们主观认可的情感词,从而为图像添加缺失的情感标签。实验结果表明,相较于缺失情感标签的图像,我们所提出的算法在给图像添加情感标签后使搜索准确率明显提升。

全文目录


摘要  4-6
ABSTRACT  6-7
目录  7-9
图目录  9-10
表目录  10-11
第1章 绪论  11-18
  1.1 研究背景与研究意义  11-14
    1.1.1 研究背景  11-13
    1.1.2 研究意义  13-14
  1.2 关键问题与研究任务  14-16
    1.2.1 关键问题  14-16
    1.2.2 研究任务  16
  1.3 论文的组织结构  16-18
第2章 图像检索研究现状  18-25
  2.1 总体研究状况  18
  2.2 基于文本的图像检索方法  18-20
  2.3 基于内容的图像检索方法  20-21
    2.3.1 基于特征的方法  20
    2.3.2 基于索引的方法  20-21
    2.3.3 其它方法  21
  2.4 近似重复图像检测方法  21-24
    2.4.1 基于特征的方法  21-23
    2.4.2 基于索引的方法  23
    2.4.3 其它方法  23-24
  2.5 本章小结  24-25
第3章 应用于近似重复图像检测的曼哈顿相关距离  25-38
  3.1 研究背景  25-26
  3.2 新距离函数的提出  26-34
    3.2.1 曼哈顿相关距离  26-27
    3.2.2 使用曼哈顿相关距离的LSH 机制  27-33
    3.2.3 通过自动扩展查询  33-34
  3.3 实验  34-36
    3.3.1 人工数据的实验  34-35
    3.3.2 实验结果及分析  35-36
  3.4 本章小结  36-38
第4章 基于近似重复图像检测的图像标注  38-58
  4.1 研究背景  38-41
  4.2 图像标注研究调研  41-47
    4.2.1 基于共现模型的方法  41-42
    4.2.2 基于机器翻译模型的方法  42-43
    4.2.3 基于生成式模型的方法  43-44
    4.2.4 基于图模型的方法  44-46
    4.2.5 基于流行排序的方法  46-47
  4.3 系统概述  47-53
    4.3.1 近似重复图像检测  49
    4.3.2 情感标签的标注  49-53
  4.4 实验  53-57
  4.5 本章小结  57-58
第5章 工作总结与展望  58-60
  5.1 工作总结  58-59
  5.2 未来展望  59-60
参考文献  60-65
在读期间发表的学术论文  65-66
项目资助情况  66

相似论文

  1. 集装箱电子标签信息管理系统,U695.22
  2. 大规模文档标签自动标注技术研究,TP391.3
  3. 基于运动目标轨迹分析的智能交通监控系统,TP277
  4. MIMO系统中基于LDPC编码的迭代检测算法研究,TN919.3
  5. MIMO系统信号检测方法及球检测改进算法的研究,TN919.3
  6. 低压系统混合有源电力滤波器研究,TN713.8
  7. Web服务攻击分析与安全技术研究,TP393.08
  8. 基于信息融合的高速公路交通事件自动检测算法研究,U491
  9. 动漫产品设计协同原型系统的研究,TB472
  10. DCA算法和NSA算法结合的入侵检测模型研究,TP393.08
  11. 高速公路交通事件检测建模及应用研究,U491.116
  12. 基于半正定松弛SDR算法的MIMO检测技术研究,TN919.3
  13. 能削弱自相似性影响的主动队列管理策略,TN915.02
  14. 鱼探仪声纳显示软件的设计与实现,U666.7
  15. 基于FPGA的高分辨多子阵检测算法的快速实现,TP274.4
  16. 基于视频图像检测的超速抓拍系统的研究与设计,TP311.52
  17. 基于小波分析的车型识别系统,TP391.41
  18. 高光谱图像奇异目标检测技术研究,TP391.41
  19. 基于小波和希尔伯特算法的电能质量分析与检测,TM711
  20. 基于自相似模型的路由拥塞控制策略研究,TP393.07

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com