学位论文 > 优秀研究生学位论文题录展示
基于稀疏表示的图像分类与目标跟踪研究
作 者: 匡金骏
导 师: 柴毅
学 校: 重庆大学
专 业: 控制理论与控制工程
关键词: 计算机视觉分析 稀疏表示 分类器 图像分类 目标跟踪
分类号: TP391.41
类 型: 博士论文
年 份: 2013年
下 载: 1122次
引 用: 0次
阅 读: 论文下载
内容摘要
图像分类与目标跟踪是计算机视觉分析领域的分支研究方向,在人机互交、智能交通、无人机制导、智能安防等领域均具有重要的应用价值。稀疏表示(SparseRepresentation)理论是一种新兴的信号表示方法,也是一种对哺乳动物大脑皮层编码机制的模拟,近年来在计算机视觉分析领域得到了较为广泛的关注。此方法因使用超完备字典对信号进行分解,所以对信号的误差与噪声比传统方法更稳健。本文分别从基础理论和应用设计两个方面着手,重点对稀疏表示原理、稀疏表示分类器的设计和基于稀疏表示的图像分类、目标跟踪算法的国内外研究进展进行了调研,并在同行最新研究成果的基础上开展了深入研究。具体研究工作可概括如下:首先详细介绍了稀疏表示原理的研究意义,认真分析了信号稀疏表示的数学模型、稀疏性的度量方法以及稀疏表示原理在图像分类与目标跟踪中的应用情况。然后,解释了稀疏表示理论的最优解存在性的证明以及求解稀疏表示的贪婪算法与凸松弛方法。对特别是匹配追踪法及其扩展算法进行了详细阐述,另外,介绍了坐标下降法等Lasso问题求解方案,然后,提出了一种核函数非负稀疏表示分类算法以及一种结合判别分析的稀疏分类算法,为稀疏表示的计算机视觉应用奠定了基础。研究了基于稀疏表示的场景图像分类算法。首先分析了场景图像的特点,对此类任务的特殊难点进行了阐述。然后对常见的场景图像分类算法的方法和框架进行了探索,分析了这些方法的优点与不足。在以上研究的基础上,提出了一种基于多层核函数稀疏分类与多尺度分块旋转扩展的鲁棒图像分类算法。使用多种尺度的网格对训练图像进行分块,对分块图像进行旋转扩展,由此得到的字典能够近似测试图像局部的旋转扭曲与各种排列组合。为了增加字典类间的稀疏度,改善系统效率,提出了一种字典降维策略;然后通过核函数随机坐标下降(KRCD)方法高效求解稀疏分类中的凸优化问题,进而通过比较层稀疏模型中不同类测试图像的重构误差完成图像分类。此方法仅使用少量样本解决场景图像分类中最具挑战的类间相似性与类内多样性问题,与几类经典方法进行比较,此方法在小样本情况下具备更好的识别效果,对图像旋转或局部扭曲变形等复杂情况具有较好的鲁棒性。对目标跟踪算法进行了研究,深入分析了目标跟踪的难点问题,如:目标和背景之间共享相似特征、目标在运动过程中会产生形变、会被遮挡等复杂问题、目标短暂消失等问题等。对常见的目标跟踪框架即卡尔曼滤波与粒子滤波框架进行了研究,对这两种方法各自的优点和缺点进行了比较。针对经典稀疏分类目标跟踪算法中目标模板的建模和更新方式效率低、跟踪性能不可靠等问题,提出了一种基于时空约束与标准对冲的稀疏表示目标跟踪算法。对时空约束原理、目标基、背景基、时序特征池以及两类基更新机制进行了讨论,并提出了时序循环更新方法解决模版更新问题。最终,解释了在标准对冲算法框架下结合稀疏表示分类器实时地求取目标坐标的方法。在实验的基础上,证明此方法比几种经典目标跟踪算法更可靠。针对经典目标跟踪算法在光照改变、运动模糊等情况下精度不高,长时间目标跟踪不可避免发生跟踪丢失等问题,提出了一种基于核函数并行稀疏分类与稀疏分类器网格的合作目标跟踪算法。该算法也是在标准对冲框架下,结合使用核函数并行稀疏表示分类方法、自适应字典更新方法以及稀疏分类器网格等技术,保证目标跟踪算法在噪声、遮挡等恶劣环境下进行长时间跟踪的可靠性。由于跟踪算法对算法实时性的要求较高,一般的坐标下降方法求解Lasso问题速度无法满足要求,本文提出使用并行化的核函数随机坐标下降算法来高效求解稀疏系数,充分利用现代计算机多核处理器的功能解决效率问题;与其它基于稀疏表示的目标跟踪算法相似,分类器求取的分类信心值可等价转化为各粒子的代价值。然后,为了避免模板漂移问题,解释了目标字典和背景字典的在线更新方法;为了解决永久性跟踪失败的情况,设计了稀疏分类器网格的方法来粗略检测目标状态,并在目标出现之后重启主跟踪器。实验结果证明,本算法的各部分都能增强跟踪效果,相比其它几种经典目标跟踪算法,本算法具有更好的实时性和可靠性。
|
全文目录
摘要 3-5 ABSTRACT 5-11 主要符号表 11-13 1 绪论 13-27 1.1 引言 13 1.2 稀疏表示的研究意义 13-14 1.3 稀疏表示的理论研究现状 14-16 1.3.1 信号的稀疏表示 14-15 1.3.2 稀疏性的度量 15-16 1.4 相关应用的研究现状 16-23 1.4.1 分类器的研究现状 16-18 1.4.2 图像分类的研究现状 18-19 1.4.3 目标跟踪的研究现状 19-23 1.5 论文主要创新点及结构安排 23-27 2 基于稀疏表示的分类器应用研究 27-51 2.1 引言 27 2.2 稀疏表示算法原理 27-31 2.2.1 稀疏表示理论的最优解存在性的证明 28 2.2.2 求解稀疏表示的贪婪算法与凸松弛方法 28-31 2.3 一种核函数非负稀疏表示分类算法 31-34 2.3.1 非负稀疏编码的原理 31-32 2.3.2 核函数非负稀疏表示分类的原理 32-34 2.4 一种结合判别分析的稀疏分类器 34-37 2.5 实验与分析 37-48 2.5.1 使用核函数非负稀疏表示分类进行目标跟踪实验 37-41 2.5.2 使用结合判别分析的稀疏分类器进行目标跟踪实验 41-44 2.5.3 使用核函数非负稀疏表示分类器进行人脸识别比较实验 44-48 2.6 本章小结 48-51 3 基于稀疏表示的场景图像分类应用研究 51-71 3.1 引言 51-54 3.2 场景图像分类问题描述 54-59 3.2.1 场景图像分类问题的难点 54-58 3.2.2 传统解决方案 58-59 3.3 基于多层稀疏分类与多尺度分块旋转扩展的场景图像分类 59-66 3.3.1 分块旋转扩展原理与多层稀疏表示模型的构建 59-63 3.3.2 核函数稀疏分类与算法步骤 63-65 3.3.4 算法结构与流程 65-66 3.4 实验结果与分析 66-69 3.4.1 算法性能对比测试 66-67 3.4.2 算法性能分析 67-69 3.5 本章小结 69-71 4 基于时空约束与标准对冲的稀疏表示目标跟踪算法 71-87 4.1 引言 71 4.2 目标跟踪问题描述 71-74 4.3 卡尔曼滤波与粒子滤波 74-76 4.4 目标跟踪算法详解 76-83 4.4.1 算法创新 76-77 4.4.2 时空约束原理 77-80 4.4.3 基的在线更新原理 80-82 4.4.4 稀疏表示分类算法与标准对冲算法 82-83 4.5 实验结果与分析 83-86 4.6 本章小结 86-87 5 基于核函数并行稀疏分类与稀疏分类器网格的合作目标跟踪算法 87-105 5.1 引言 87-89 5.2 核函数并行稀疏表示分类方法 89-91 5.3 字典更新方法 91-92 5.4 标准对冲 92-94 5.5 稀疏分类器网格 94-96 5.6 实验 96-102 5.6.1 性能测试实验 96-98 5.6.2 综合对比实验 98-102 5.7 总结 102-105 6 总结与展望 105-109 6.1 本文工作总结 105-106 6.2 后续工作展望 106-109 致谢 109-111 参考文献 111-123 附录 123-124 A. 作者攻读期间参与的相关科研项目 123 B. 作者攻读期间发表的相关科研论文 123-124 C. 作者攻读期间正在处理的相关科研论文 124
|
相似论文
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 空间交会接近视觉测量方法研究,TP391.41
- 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 基于粒子滤波的自主机器人视觉目标跟踪研究,TP242
- 红外图像目标识别及跟踪技术研究,TP391.41
- 空间红外目标仿真与跟踪技术研究,TP391.41
- 基于运动目标轨迹分析的智能交通监控系统,TP277
- 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
- 基于“词袋”模型的图像分类系统,TP391.41
- 人脸检测算法的FPGA设计与实现,TP391.41
- 基于分类器融合的人脸识别研究,TP391.41
- 基于稀疏表示的人脸识别算法研究,TP391.41
- 基于纹理特征的图像分类研究,TP391.41
- 基于AdaBoost算法的人脸检测方法研究,TP391.41
- 学习表达式的映射机制研究,TP181
- 无线传感器网络的目标跟踪算法研究,TN929.5
- 基于稀疏表示残差融合的人脸表情识别,TP391.41
- 基于无线传感器网络的目标定位跟踪研究,TN929.5
- 基于小波变换的信号稀疏表示及其在图像去噪中的应用,TP391.41
- 高尔夫球童机器人视觉跟踪模块设计,TP242.62
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|