学位论文 > 优秀研究生学位论文题录展示
基于区域特征的有监督图像语义标注
作 者: 杨芳芳
导 师: 王加俊;石霏
学 校: 苏州大学
专 业: 信号与信息处理
关键词: 图像语义检索 图像标注 高斯混合模型 监督学习 区域间相关性
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 72次
引 用: 0次
阅 读: 论文下载
内容摘要
随着数字图像以及图像数据库数量的快速增长,图像检索已成为信息检索领域中的一个重要研究方向,它的目的是从图像数据库中快速提取出与查询相关的图像或者图像序列,使用户能迅速获取需要的特定图像。基于内容的图像检索建立在对图像底层特征的提取和分析、匹配的基础之上,无法解决图像底层特征与高层的语义概念表达之间存在着巨大的差异的问题,即“语义鸿沟”的问题。因而图像语义检索成为了图像检索技术研究的热点。基于语义的图像标注是基于语义的图像检索的关键组成部分。本论文详细阐述了图像标注的发展历程,并提出了几种基于区域特征的有监督图像语义标注算法。本文的主要贡献在以下几点:首先,提出一种改进的基于高斯混合模型的有监督图像语义标注方法。该方法主要包括图像分割(J-value segmentation, JSEG)、底层颜色和纹理特征的提取、利用期望最大化(Expectation Maximization, EM)算法训练基于高斯混合模型的概念分类器、去除噪声区域更新概念分类器和对测试图像进行语义概念标注等步骤。对于每一个概念均获得两个基于高斯混合模型的分类器,即颜色分类器和纹理分类器,并结合去除与概念无关的噪声区域的方法更新概念分类器,在标注阶段采取决策级融合技术。在Trecvid2005视频图像库上的实验证明,利用本文算法获得的标注结果较传统的对每一个概念都建立一个概念分类器的方法所得的图像标注性能有较大的提高。其次,提出一种基于区域间关系的有监督图像语义标注方法。图像的某一语义概念往往与图像的许多区域特征有关系,这些区域间也存在着语义相关性,因而本方法在对测试图像进行语义标注时,提出了考虑测试图像区域间相关性的算法,且通过在Trecvid2005视频库和Corel5K库上的实验证明了该算法的可靠性和有效性。另外也分析比较了图像均匀分割和JSEG分割算法,使用均匀分割代替JSEG分割,并结合考虑图像区域之间相关性的方法,进一步提高了图像的语义标注性能。
|
全文目录
中文摘要 4-5 Abstract 5-9 第一章 绪论 9-14 1.1 图像标注的研究背景和意义 9-11 1.2 研究现状 11-12 1.3 论文的主要研究内容 12 1.4 论文的章节安排 12-14 第二章 图像语义标注的相关技术概述 14-23 2.1 图像标注的发展历程 14-16 2.2 图像语义描述模型 16-17 2.3 图像语义检索的组成模块 17-22 2.3.1 底层特征提取与表达 17-19 2.3.2 相似性度量方法 19-20 2.3.3 “语义鸿沟”缩减 20-22 2.4 本章小结 22-23 第三章 基于GMM 的有监督图像语义标注 23-40 3.1 基于图像区域的监督语义概念标注 23-25 3.2 基于GMM 的有监督图像语义标注方法 25-31 3.2.1 图像分割和底层特征提取 25-27 3.2.2 利用EM 算法和GMM 表示图像的语义 27-29 3.2.3 基于决策融合和去噪的监督图像语义学习算法 29-30 3.2.4 图像语义概念的自动标注 30-31 3.3 实验配置和标注性能评价标准 31-36 3.3.1 实验设置 31-35 3.3.2 实验标注性能评价标准 35-36 3.4 实验结果与分析 36-39 3.4.1 Trecvid2005 36-38 3.4.2 Corel5K 38-39 3.5 本章小结 39-40 第四章 基于区域间关系的有监督图像语义标注 40-48 4.1 基于区域间关系的方法的基本理论 40-41 4.2 一种基于图像区域间关系的图像标注方法 41-44 4.2.1 图像分割方法和底层特征的提取 41-42 4.2.2 图像区域间关系的表示方法 42-43 4.2.3 考虑图像区域间关系的图像标注方法 43-44 4.3 实验结果 44-47 4.3.1 实验配置 44 4.3.2 实验结果及分析比较 44-47 4.4 本章小结 47-48 第五章 总结和展望 48-50 5.1 总结 48 5.2 今后的工作和展望 48-50 参考文献 50-56 攻读硕士学位期间发表的论文 56-57 缩略词表 57-58 致谢 58-59
|
相似论文
- 高质量语音转换系统中关键技术的研究,TN912.3
- 基于组合及统计的图像型垃圾邮件检测研究,TP391.41
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- 长文本辅助短文本的知识迁移聚类方法,TP391.1
- 基于半监督哈希算法的图像检索方法研究,TP391.41
- 基于半监督学习的时间序列分类研究与实现,TP181
- 蛋白质关系网络中的络合物发现算法的研究,Q51-3
- 数据挖掘在研究生调剂中的应用研究,TP311.13
- 半监督学习中协同训练与多视图方法的比较及改进,TP18
- 无线传感器网络中的追击者—逃跑者跟踪问题研究,TP212.9
- 基于半监督SVM的入侵检测研究,TP393.08
- 基于稀疏回归模型的图像标注研究,TP391.41
- 面向自然场景分类的稀疏编码研究与应用,TP391.41
- 面向金融问答的论坛观点挖掘,TP391.3
- 基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
- 基于支持向量机的水电故障分类器的设计与实现,TV738
- 健壮的流形学习算法及其应用研究,TP181
- 半监督学习若干问题的研究,TP181
- 高斯混合模型及在探测网络社区结构中的应用,TP393.094
- 基于少量标记数据约束聚类算法的入侵检测技术研究,TP393.08
- 基于半监督学习的中文问句分类研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|