学位论文 > 优秀研究生学位论文题录展示

基于稀疏编码与机器学习的图像内容识别算法研究

作　者: 唐峰
导　师: 蒋兴浩；孙锬锋
学　校: 上海交通大学
专　业: 通信与信息系统
关键词: 图像内容识别稀疏编码机器学习随机森林支持向量机多示例学习
分类号: TP391.41
类　型: 硕士论文
年　份: 2011年
下　载: 202次
引　用: 1次
阅　读: 论文下载

内容摘要

随着数字图像和互联网技术的高速发展,每天都有海量的图像数据生成和共享。如何有效地组织海量的图像数据,使得用户能够快速而准确的检索到所需的图片越来越重要。在此背景下,图像内容识别成为计算机视觉领域的研究热点之一。图像内容识别是将从视觉获取的输入图像,通过一系列的计算、分析和学习过程,输出得到场景中的对象识别,场景中对象之间的关系描述,场景的识别等。简而言之,图像内容识别是用计算机实现人类对于图像的视觉理解功能。此外,图像内容识别的应用不局限于基于内容的图像检索,还应用于如机器人视觉,遥感图像识别,医学图像识别,生物特征鉴别等诸多领域。本文首先总结并分析了近年来国内外图像内容识别研究的成果,然后将本文的研究重点定于基于稀疏编码模型和机器学习的图像内容分类,对象识别和区域定位。本文提出了一种基于空间稀疏编码模型与随机森林的图像分类算法。该算法首先提取图像的SIFT特征;然后使用稀疏编码理论生成基于SIFT特征的视觉词汇库,并利用该视觉词汇库将SIFT特征转换成稀疏向量;通过稀疏向量的区域融合和空间结合后,获取一个固定维数的整体稀疏向量用于表示图像;最后使用随机森林多分类器对表示图像的稀疏向量进行训练和测试,实验所使用的数据集为标准测试库Caltech-101和Scene-15。实验结果表明,该算法有效的表示图像的特性并提升分类的准确率,具有更佳的性能。本文提出一种创新的基于图像分割、稀疏编码模型与多示例学习的对象识别及区域定位算法。该算法引入多示例学习的概念,将图像作为多示例的包,图像中由SIFT特征转化的稀疏特征作为包中示例,稀疏编码模型生成的视觉词汇库作为特征空间,通过对包中示例个数的统计将其映射到特征空间中,然后用1-norm SVM其来对图像进行分类并且生成权重用于挑选重要的示例即图像特征。最后使用图像分割及示例分类来确定对象在图像中的区域。实验使用的数据集为Caltech-101和Scene-15,实验结果表明,该算法对图像进行分类的准确率较高,并且能够较为准确地定位其所包含对象的位置。

全文目录

摘要  3-5
ABSTRACT  5-10
第1章绪论  10-17
  1.1 本文的研究背景及意义  10-11
  1.2 相关研究工作  11-15
    1.2.1 图像特征提取研究  11-14
    1.2.2 图像特征融合研究  14
    1.2.3 特征的学习与识别  14-15
  1.3 论文的研究内容及创新  15-16
  1.4 论文的章节安排  16-17
第2章相关理论基础  17-29
  2.1 引言  17
  2.2 尺度不变特征转换  17-20
  2.3 稀疏编码的数学描述  20-22
  2.4 分类器的研究  22-25
    2.4.1 支持向量机  22-24
    2.4.2 随机森林  24-25
  2.5 多示例学习  25-28
    2.5.1 经典多示例学习算法  26-27
    2.5.2 多示例学习的应用  27-28
  2.6 本章小结  28-29
第3章基于空间稀疏编码模型的图像分类算法  29-45
  3.1 引言  29
  3.2 稀疏编码模型及其优点  29-31
  3.3 算法的整体框架  31-32
  3.4 基于空间稀疏编码模型的图像表示  32-34
    3.4.1 视觉词汇库生成  32
    3.4.2 图像的空间表示  32-34
  3.5 基于随机森林的图像特征分类  34-36
    3.5.1 构造随机决策树  35-36
    3.5.2 图像特征的分类  36
  3.6 实验结果与分析  36-43
    3.6.1 实验配置  38
    3.6.2 空间划分对准确率的影响  38-39
    3.6.3 视觉词汇库尺寸对准确率的影响  39-40
    3.6.4 特征融合方法对准确率的影响  40
    3.6.5 不同图像表示方法的准确率对比  40-41
    3.6.6 不同稀疏编码模型的准确率对比  41-42
    3.6.7 图像分类算法的准确率对比  42-43
  3.7 本章小结  43-45
第4章基于多示例学习的对象识别及定位算法  45-65
  4.1 引言  45
  4.2 基于支持向量机的多示例学习算法  45-50
    4.2.1 多示例学习分类  46
    4.2.2 MILES 算法  46-50
  4.3 算法的整体框架  50-51
  4.4 基于稀疏编码与MILES 算法的图像分类  51-54
    4.4.1 基于稀疏编码的视觉词汇库生成  52
    4.4.2 基于MILES 算法的图像分类  52-54
  4.5 基于示例分类与图像分割的对象定位  54-57
    4.5.1 图像分割  54-55
    4.5.2 基于示例分类的对象区域确定  55-57
  4.6 实验结果与分析  57-64
    4.6.1 实验配置  57-58
    4.6.2 图像分类准确率  58-62
    4.6.3 对象区域确定实验结果  62-64
  4.7 本章小结  64-65
第5章总结与展望  65-67
  5.1 论文工作总结  65
  5.2 工作展望  65-67
参考文献  67-72
致谢  72-73
攻读硕士学位期间已发表或录用的论文  73
攻读硕士学位期间参加的课题与项目  73-76
上海交通大学硕士学位论文答辩决议书  76

基于稀疏编码与机器学习的图像内容识别算法研究

内容摘要

全文目录

相似论文