学位论文 > 优秀研究生学位论文题录展示

基于稀疏编码与机器学习的图像内容识别算法研究

作 者: 唐峰
导 师: 蒋兴浩;孙锬锋
学 校: 上海交通大学
专 业: 通信与信息系统
关键词: 图像内容识别 稀疏编码 机器学习 随机森林 支持向量机 多示例学习
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 202次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着数字图像和互联网技术的高速发展,每天都有海量的图像数据生成和共享。如何有效地组织海量的图像数据,使得用户能够快速而准确的检索到所需的图片越来越重要。在此背景下,图像内容识别成为计算机视觉领域的研究热点之一。图像内容识别是将从视觉获取的输入图像,通过一系列的计算、分析和学习过程,输出得到场景中的对象识别,场景中对象之间的关系描述,场景的识别等。简而言之,图像内容识别是用计算机实现人类对于图像的视觉理解功能。此外,图像内容识别的应用不局限于基于内容的图像检索,还应用于如机器人视觉,遥感图像识别,医学图像识别,生物特征鉴别等诸多领域。本文首先总结并分析了近年来国内外图像内容识别研究的成果,然后将本文的研究重点定于基于稀疏编码模型和机器学习的图像内容分类,对象识别和区域定位。本文提出了一种基于空间稀疏编码模型与随机森林的图像分类算法。该算法首先提取图像的SIFT特征;然后使用稀疏编码理论生成基于SIFT特征的视觉词汇库,并利用该视觉词汇库将SIFT特征转换成稀疏向量;通过稀疏向量的区域融合和空间结合后,获取一个固定维数的整体稀疏向量用于表示图像;最后使用随机森林多分类器对表示图像的稀疏向量进行训练和测试,实验所使用的数据集为标准测试库Caltech-101和Scene-15。实验结果表明,该算法有效的表示图像的特性并提升分类的准确率,具有更佳的性能。本文提出一种创新的基于图像分割、稀疏编码模型与多示例学习的对象识别及区域定位算法。该算法引入多示例学习的概念,将图像作为多示例的包,图像中由SIFT特征转化的稀疏特征作为包中示例,稀疏编码模型生成的视觉词汇库作为特征空间,通过对包中示例个数的统计将其映射到特征空间中,然后用1-norm SVM其来对图像进行分类并且生成权重用于挑选重要的示例即图像特征。最后使用图像分割及示例分类来确定对象在图像中的区域。实验使用的数据集为Caltech-101和Scene-15,实验结果表明,该算法对图像进行分类的准确率较高,并且能够较为准确地定位其所包含对象的位置。

全文目录


摘要  3-5
ABSTRACT  5-10
第1章 绪论  10-17
  1.1 本文的研究背景及意义  10-11
  1.2 相关研究工作  11-15
    1.2.1 图像特征提取研究  11-14
    1.2.2 图像特征融合研究  14
    1.2.3 特征的学习与识别  14-15
  1.3 论文的研究内容及创新  15-16
  1.4 论文的章节安排  16-17
第2章 相关理论基础  17-29
  2.1 引言  17
  2.2 尺度不变特征转换  17-20
  2.3 稀疏编码的数学描述  20-22
  2.4 分类器的研究  22-25
    2.4.1 支持向量机  22-24
    2.4.2 随机森林  24-25
  2.5 多示例学习  25-28
    2.5.1 经典多示例学习算法  26-27
    2.5.2 多示例学习的应用  27-28
  2.6 本章小结  28-29
第3章 基于空间稀疏编码模型的图像分类算法  29-45
  3.1 引言  29
  3.2 稀疏编码模型及其优点  29-31
  3.3 算法的整体框架  31-32
  3.4 基于空间稀疏编码模型的图像表示  32-34
    3.4.1 视觉词汇库生成  32
    3.4.2 图像的空间表示  32-34
  3.5 基于随机森林的图像特征分类  34-36
    3.5.1 构造随机决策树  35-36
    3.5.2 图像特征的分类  36
  3.6 实验结果与分析  36-43
    3.6.1 实验配置  38
    3.6.2 空间划分对准确率的影响  38-39
    3.6.3 视觉词汇库尺寸对准确率的影响  39-40
    3.6.4 特征融合方法对准确率的影响  40
    3.6.5 不同图像表示方法的准确率对比  40-41
    3.6.6 不同稀疏编码模型的准确率对比  41-42
    3.6.7 图像分类算法的准确率对比  42-43
  3.7 本章小结  43-45
第4章 基于多示例学习的对象识别及定位算法  45-65
  4.1 引言  45
  4.2 基于支持向量机的多示例学习算法  45-50
    4.2.1 多示例学习分类  46
    4.2.2 MILES 算法  46-50
  4.3 算法的整体框架  50-51
  4.4 基于稀疏编码与MILES 算法的图像分类  51-54
    4.4.1 基于稀疏编码的视觉词汇库生成  52
    4.4.2 基于MILES 算法的图像分类  52-54
  4.5 基于示例分类与图像分割的对象定位  54-57
    4.5.1 图像分割  54-55
    4.5.2 基于示例分类的对象区域确定  55-57
  4.6 实验结果与分析  57-64
    4.6.1 实验配置  57-58
    4.6.2 图像分类准确率  58-62
    4.6.3 对象区域确定实验结果  62-64
  4.7 本章小结  64-65
第5章 总结与展望  65-67
  5.1 论文工作总结  65
  5.2 工作展望  65-67
参考文献  67-72
致谢  72-73
攻读硕士学位期间已发表或录用的论文  73
攻读硕士学位期间参加的课题与项目  73-76
上海交通大学硕士学位论文答辩决议书  76

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 基于多示例学习的用户关注概念区域发现,TP391.41
  9. 图像的稀疏表示及编码模型研究,TP391.41
  10. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  11. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 多样性密度学习算法的研究与应用,TP181
  14. 基于支持向量机的故障诊断方法研究,TP18
  15. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  16. 基于随机森林的植物抗性基因识别方法研究,Q943
  17. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  18. 基于车载3D加速传感器的路况监测研究,TP274
  19. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  20. 基于数据分布特征的文本分类研究,TP391.1
  21. 基于机器学习的入侵检测系统研究,TP393.08

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com