学位论文 > 优秀研究生学位论文题录展示
基于多特征集成的图像自动标注方法研究
作 者: 郑钰
导 师: 何东健
学 校: 西北农林科技大学
专 业: 计算机应用技术
关键词: 图像 自动标注 多特征集成 分类 感兴趣区域 特征选择
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 47次
引 用: 0次
阅 读: 论文下载
内容摘要
随着数码设备和计算机网络的发展及广泛应用,数字图像在计算机中的存储量呈爆炸式的增长。为了实现计算机对海量图像的自动管理,图像检索特别是图像自动标注成为近年来研究的重点和热点。针对图像的多标注问题和“语义鸿沟”问题,本文研究使用多特征集成的图像自动标注方法,以进一步提高图像自动标注的性能。本文的主要研究内容和创新点如下:(1)为解决传统图像标注中标注词与图像区域之间缺乏对应关系的问题,本文在对未标注图像进行标注之前,引入分割算法将图像划分成若干个图像区域,并对每个图像区域分别进行图像自动标注的策略,使图像区域与标注词之间建立起一一对应的关系。(2)鉴于目前图像自动标注中只有少量已标注样本的实际情况,本文采用半监督学习方法思想来建立标注模型。该方法同时将已标注样本和未标注样本用于机器学习中,并利用图像底层视觉特征空间的分布信息,来度量未标注图像到各标注词之间的视觉特征距离,从而为未标注图像选择标注关键词。(3)针对图像自动标注系统多采用单个分类器,从而导致标注准确率较低问题,本文研究并提出基于多特征集成的图像自动标注算法EMDAIA。该算法将图像自动标注问题看作是图像的多分类问题,构造并集合多个分类器的分类结果,选择出现概率最大的预测词来对图像进行标注。EMDAIA使用LabelMe图像数据库进行实验,实验结果表明,EMDAIA比仅使用单一特征进行图像自动标注的准确率提高了约10%。(4)研究并提出一种基于感兴趣区域的图像自动标注方法ROIAIA,该方法在对未标注图像进行标注前,先采用Itti模型提取图像的感兴趣区域,然后对提取的感兴趣区域进行标注。实验表明,基于感兴趣区域的图像自动标注能有效地减少图像次要区域对主要区域的影响,将图像自动标注的注意力集中到用户感兴趣的图像区域。(5)研究了特征子集的选择对图像自动标注性能的影响,对提取的10种视觉特征选择后组合成10个不同的特征子集,在PASCAL VOC 2008图像数据库上进行实验,结果表明:使用多特征集成可以提高分类器的分类性能,8种视觉特征构造特征子集时图像标注的平均准确率最高,继续增加特征的种类反而会降低标注结果的准确率。
|
全文目录
摘要 5-6 ABSTRACT 6-10 第一章 绪论 10-17 1.1 研究目的与意义 10-13 1.1.1 图像自动标注是图像检索的关键技术 10-12 1.1.2 图像自动标注具有广泛的应用前景 12-13 1.2 国内外研究现状 13-14 1.2.1 国内研究现状 13 1.2.2 国外研究现状 13-14 1.3 存在问题 14-15 1.4 本文的研究内容 15 1.5 论文的组织结构 15-17 第二章 图像自动标注的相关技术 17-24 2.1 图像自动标注基本框架 17 2.2 图像的视觉特征表示 17-21 2.2.1 图像分割 18-20 2.2.2 图像视觉特征提取 20-21 2.3 图像的相似性度量 21-22 2.4 标注模型 22-23 2.5 本章小结 23-24 第三章 基于多特征集成的图像自动标注方法 24-39 3.1 EMDAIA 基本思想 24-25 3.2 集成学习 25-29 3.2.1 为什么使用集成学习 25 3.2.2 集成学习的思想和方法 25-29 3.2.3 单分类器分类结果的整合方法 29 3.3 EMDAIA 基本框架 29-33 3.3.1 模型训练阶段 30-31 3.3.2 测试阶段 31-33 3.4 实验结果与分析 33-38 3.4.1 实验数据 33 3.4.2 特征提取 33-35 3.4.3 几种距离度量方法标注结果比较 35-36 3.4.4 多特征集成和单一特征实验结果及分析 36-38 3.5 本章小结 38-39 第四章 基于感兴趣区域的图像自动标注方法 39-48 4.1 图像的感兴趣区域 39-40 4.2 ROIAIA 基本框架 40-43 4.2.1 特征选择 41-42 4.2.2 模型训练阶段 42-43 4.2.3 测试阶段 43 4.3 实验结果与分析 43-46 4.3.1 实验数据 43-44 4.3.2 特征子集的构造 44-45 4.3.3 实验结果 45-46 4.4 本章小结 46-48 第五章 结论与展望 48-50 5.1 结论 48 5.2 展望 48-50 参考文献 50-54 致谢 54-55 作者简介 55
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 熔化极气体保护焊熔滴过渡图像分析系统,TG444
- 基于CCD图像传感器的温度测量技术研究,TH811
- CMOS星敏感器图像采集系统研究,V448.2
- 电缆巡检车图像引导技术的研究,U469.6
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 高光谱图像空—谱协同超分辨处理研究,TN911.73
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 图像拼接技术研究,TP391.41
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 空中目标与背景的红外图像仿真技术研究,TP391.41
- 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
- 双传感器图像联合目标检测及系统实现研究,TP391.41
- 雾天或背光条件下图像清晰化算法研究及硬件实现,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 基于内容的服装图像检索技术研究及实现,TP391.41
- 基于多示例学习的用户关注概念区域发现,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|