学位论文 > 优秀研究生学位论文题录展示

基于Web的图像自动标注方法

作 者: 户保田
导 师: 王晓龙
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 图像自动标注 语义鸿沟 机器学习 互联网信息
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 31次
引 用: 0次
阅 读: 论文下载
 

内容摘要


基于内容的图像检索存在图像原始的底层特征与用户抽象的深层语义之间的“语义鸿沟”,目前缩小“语义鸿沟”的方法还不够理想。随着Web2.0的发展,越来越多的互联网用户在向互联网上传图片时,同时会附加相应的文本信息对图片予以描述或说明。这些信息对于分析图像的语义内容、挖掘图像检索用户意图具有重要作用。以往研究者主要偏重从机器学习的角度对图像自动标注进行研究,对于如何有效利用这些信息并没有给予充分的考虑与重视。基于机器学习的图片自动标注方法需要大量的参数优化与复杂的学习过程,不能快速的对大量网络图片进行有效的标注,基于此本文设计并实现了基于Web的图像自动标注方法。该方法首先利用图像的文本化表示对图像进行特征提取;然后使用图像检索技术,检索出与要标注的图像相似的图像列表;通过对这些图像的周围文本信息进行综合处理,最后挖掘出待标注图像丰富的语义标注。本文的主要贡献概括为如下几部分:(1)首先,通过使用图像处理技术和快速流式K-means聚类算法,实现图像的文本化表示,将文本领域的方法应用到图像处理中,从而简化图像检索与处理时的工作。(2)再次,为有效的分析基于机器学习的图像自动标注方法的特点,在图像文本化的基础上,实现两种当前效果较好的多类标分类方法MLKNN和MFoM。在此基础上分析基于机器学习的图像自动标注方法的优缺点。(3)最后,为克服基于机器学习的图像自动标注方法的缺点,解决快速增长的互联网图片的自动标注问题。本文通过利用互联网图片的周围文本信息对图像进行有效的语义标注,设计并实现了基于Web的图像语义自动标注方法的整体架构以及详细算法。该方法综合利用图像的文本化表示、基于内容的图像检索方式以及自然语言处理技术对图像进行自动标注。实验结果表明,当图像数据规模较大、图片语义标签较多的情况下,基于Web的图像自动标注方法在准确率和召回率方面,都明显优于基于机器学习的图像自动标注方法。该方法不需要大量的参数优化和复杂的学习过程,避免对训练集进行大量的人工标注过程,能够从相对“稀少”的图像标签中挖掘出相对丰富的语义内容。

全文目录


摘要  4-5
Abstract  5-6
目录  6-8
第1章 绪论  8-16
  1.1 课题目的及意义  8-10
  1.2 研究现状  10-14
  1.3 课题主要内容  14-16
第2章 相关技术介绍  16-27
  2.1 图像特征提取方法  16-17
    2.1.1 颜色特征提取  16
    2.1.2 纹理特征提取  16-17
    2.1.3 局部特征提取  17
    2.1.4 形状特征提取  17
  2.2 图像相似度计算方法  17-18
  2.3 常用聚类方法  18-21
    2.3.1 K-Means 聚类算法  18-20
    2.3.2 流式快速 K-Means 聚类算法  20-21
  2.4 多类标分类算法  21-26
    2.4.1 多类标分类概述  21-22
    2.4.2 ML-KNN 分类方法  22-23
    2.4.3 MFoM 分类方法  23-26
  2.5 本章小结  26-27
第3章 基于机器学习图像自动标注方法  27-35
  3.1 图像的文本化表示  27-30
    3.1.1 图像文本化分割  28
    3.1.2 图像词典学习  28-30
  3.2 图像文本化特征提取  30-31
  3.3 多类标分类器设计与实现  31-34
    3.3.1 MFoM 分类器设计与实现  31-32
    3.3.2 MLKNN 分类算法设计与实现  32-34
  3.4 本章小结  34-35
第4章 基于 Web 的图像自动标注方法  35-43
  4.1 算法描述  35-37
  4.2 算法整体设计  37
  4.3 图像检索子系统  37-39
    4.3.1 图像文本化特征提取  37-38
    4.3.2 图像库检索  38
    4.3.3 检索结果排序  38-39
  4.4 图像标注子系统  39-42
    4.4.1 检索结果描述文本处理  39-40
    4.4.2 语义标签的权值计算  40-41
    4.4.3 图像语义标签获取与详细算法  41-42
  4.5 本章小结  42-43
第5章 实验评测与结果分析  43-49
  5.1 实验数据介绍  43-44
  5.2 评测标准介绍  44
  5.3 实验结果及分析  44-47
  5.4 一些图片标注的例子  47-48
  5.5 本章小结  48-49
结论  49-50
参考文献  50-53
攻读学位期间发表的学术论文  53-55
致谢  55

相似论文

  1. 英汉命名实体翻译方法研究,TP391.2
  2. 生物医学缩略语消歧,R-5
  3. 基于数据分布特征的文本分类研究,TP391.1
  4. 人类抗原肽载体结合力预测,R392.1
  5. 李群深层结构学习算法研究,TP181
  6. 机器学习算法在视频指纹识别中的应用研究,TP391.41
  7. 蛋白质关系抽取中平面特征和结构化信息的研究,TP181
  8. 基于李群机器学习算法的智能布线,TN710
  9. 学习表达式的映射机制研究,TP181
  10. Android恶意软件静态检测方案的研究,TP309
  11. 基于对象语义的图像检索,TP391.41
  12. 图像语义自动标注方法的研究,TP391.41
  13. 基于机器学习算法的自动图像标注,TP391.41
  14. 基于多特征集成的图像自动标注方法研究,TP391.41
  15. 互联网产品评论量化关键技术研究,TP391.1
  16. 文本情感倾向分类方法在评论有用性分析中的实现与应用,TP391.1
  17. 基于文本信息与视觉信息相结合的Web图像检索,TP391.41
  18. CC-NUMA系统中Cache一致性协议模拟验证方法研究,TP306
  19. 基于情感语义相似度的音乐检索模型研究,TP391.3
  20. 基于机器学习的生物多样性中文文档的信息抽取研究,G350
  21. 基于机器学习的中文文本分类方法研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com