学位论文 > 优秀研究生学位论文题录展示

基于场景语义图像标注关键技术的研究

作 者: 付杰
导 师: 于林森
学 校: 哈尔滨理工大学
专 业: 计算机应用技术
关键词: 图像标注 概率潜在语义分析 高斯混合模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 57次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机技术的发展以及互联网应用的兴起,如何有效地管理与检索图像已成为目前信息检索领域中的重要课题。由于传统的基于内容的图像检索方式无法解决“语义鸿沟”(低层的视觉特征与高层的语义表达存在巨大的差异)问题,基于语义的图像检索正逐渐成为研究的热点。基于语义的图像检索的关键和难点在于基于语义的图像标注。本文回顾了图像标注的发展历程及其各自的基本理论的优缺点,全面综述了基于语义的图像标注的研究现状。本文的工作主要体现在:提出了一种基于概率潜在语义分析高斯混合模型相结合的自动语义图像标注方法。该方法主要包括图像低层视觉特征提取、利用概率潜在语义分析技术对训练图像进行潜在语义发现、图片的高斯混合模型表示等过程。首先,将训练集中的每一幅图像都看成是一篇文档,将对图像进行标注的关键字看成是文档中所含有的词汇,将通过上述方式构建得到的“文档—词汇”矩阵作为概率潜在语义分析模型的输入值,通过期望最大值算法对概率潜在语义分析模型进行拟合,得到模型参数,并以此作为依据来对图像进行类别划分和提取图像的潜在语义。其次,通过图像分割技术将每幅图像都分割成几个均匀的区域,将同一类别下每幅图像的各个区域都看成是特征空间中的一个点,提取每个区域的特征向量并通过期望最大值算法对其进行聚类,得到表示每一个图像类别的高斯混合模型。最后,计算测试图像在每个高斯混合模型中后验概率的大小,并结合该图像类别下关键字的分布规律来对测试图像进行语义标注。本文提出的图像语义标注方法不需要事先知道训练图像的分类信息,在相关图像数据集上的实验结果表明,本文所提出的方法能对图像进行较好的语义标注。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-18
  1.1 研究背景  10-13
  1.2 图像标注的国内外研究现状  13-15
    1.2.1 图像标注的国外研究现状  13-15
    1.2.2 图像标注的国内研究现状  15
  1.3 论文研究的内容和意义  15-17
    1.3.1 论文课题来源  15-16
    1.3.2 本文研究的主要内容  16
    1.3.3 本文研究的意义  16-17
  1.4 论文的组织结构  17-18
第2章 图像低层视觉特征提取  18-36
  2.1 概述  18
  2.2 颜色特征提取  18-24
    2.2.1 颜色空间模型  18-22
    2.2.2 常用的颜色特征表达方法  22-24
  2.3 纹理特征提取  24-35
    2.3.1 Tamura 纹理特征集  25-26
    2.3.2 灰度共生矩阵  26-30
    2.3.3 利用Gabor 小波的图像纹理特征提取方法  30-35
  2.4 形状特征提取  35
  2.5 本章小结  35-36
第3章 图像场景语义的提取  36-45
  3.1 概述  36-38
  3.2 潜在语义分析模型简介  38-39
  3.3 概率潜在语义分析及用其提取图像的场景语义  39-42
  3.4 图像场景语义发现  42-44
  3.5 实验结果及分析  44
  3.6 本章小结  44-45
第4章 基于语义的图像标注  45-54
  4.1 概述  45-46
  4.2 图像分割  46-47
  4.3 高斯混合模型  47-49
  4.4 图像类的高斯混合模型表示  49-50
  4.5 测试图像的标注  50-51
  4.6 实验结果及分析  51-53
  4.7 本章小结  53-54
结论  54-55
参考文献  55-59
攻读硕士学位期间所发表的学术论文  59-60
致谢  60

相似论文

  1. 高质量语音转换系统中关键技术的研究,TN912.3
  2. 基于组合及统计的图像型垃圾邮件检测研究,TP391.41
  3. 面向情感的电影背景音乐分类方法研究,TP391.1
  4. 多特征融合的视觉跟踪算法研究,TP391.41
  5. 基于ML_pLSA模型和特征包算法的目标识别方法,TP391.41
  6. 无线传感器网络中的追击者—逃跑者跟踪问题研究,TP212.9
  7. 基于稀疏回归模型的图像标注研究,TP391.41
  8. 局部描述特征结合概率潜在语义模型的场景分类技术研究,TP391.41
  9. 高斯混合模型及在探测网络社区结构中的应用,TP393.094
  10. 运动人体检测与异常行为识别技术研究与实现,TP391.41
  11. 基于语义分析的产品评论挖掘技术研究,TP391.1
  12. 面向智能视频监控的事件检测建模及优化,TP391.41
  13. 层析芯片阳性信号的信息提取和定量分析研究,TP391.41
  14. 虚拟人运动合成技术及其工程应用研究,TP391.41
  15. 基于因子分析的说话人确认,TN912.34
  16. 关于若干回归模型的研究,O212.1
  17. 基于隐马尔科夫模型的股价走势预测,F830.91
  18. 基于分类及相似性的图像型垃圾邮件检测技术研究,TP393.098
  19. 面向图像标注的图像分割与特征提取技术研究,TP391.41
  20. CG图像和相机图像的检测与分类标注,TP391.41
  21. 基于机器学习算法的自动图像标注,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com