学位论文 > 优秀研究生学位论文题录展示

复杂场景中的时空特征学习与人体行为分析

作 者: 朱岩
导 师: 刘允才
学 校: 上海交通大学
专 业: 模式识别与智能系统
关键词: 动作识别 稀疏编码 深度学习 深度置信网络 特征学习 轨迹聚类 人流计数
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 330次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文围绕计算机视觉中一个重要问题:在复杂场景下的人体行为分析以及视频中的时空特征学习展开研究。此研究不仅涉及了计算机视觉的特征检测与描述等底层问题,同时面向了机器学习领域内的高层语义分析。本文主要研究了在视频中对人体动作的分类与识别,包括时空局部特征的稀疏编码表示,时空特征的深度非监督学习,基于非监督贝叶斯轨迹聚类的人流分析等问题。作者经过研究实验,对上述问题进行了细致的分析和研究,提出了一些具有创新性的算法,并应用于工程实践中,得到了一些有价值的实验和理论结论:(1)对复杂场景下的人体动作识别进行了研究。本文提出通过对视频中局部时空特征进行稀疏编码,来取代传统的词袋模型,并使用最大值合并获得视频的最终特征表达。同时该方法还研究了稀疏编码字典学习的算法,利用迁移学习的理论提高了字典的泛化能力,进而提高了分类效果。(2)针对时空特征学习问题进行研究。受深度学习理论的启发,本文尝试了一种分层,分布式的概率模型,利用非监督学习,从视频中学习具有不变性的时空特征。该模型可以从数据中以自底向上的非监督学习范式自动学习得到分层的特征表达。本文通过实验证明,该模型通过不使用任何先验信息的非监督学习,可以取得与监督学习相类似的实验结果,从而证明了该方法的潜力。(3)本文研究了在复杂密集场景下,通过对人流轨迹的跟踪和聚类,估计人流数目和密度的算法。本方法不采用任何先验的人体模型进行人体检测,仅通过视频中的底层视觉信息跟踪得到轨迹,并通过非监督的聚类标准对轨迹之间相似度进行度量,并根据贝叶斯公式进行合并和聚类。在实验环节,作者和实验室同仁拍摄数据,并验证了算法的有效性。

全文目录


摘要  5-7
ABSTRACT  7-11
第一章 绪论  11-14
  1.1 课题背景和意义  11-12
  1.2 研究现状  12-13
  1.3 本文主要内容  13-14
第二章 基于时空特征和稀疏编码的人体动作识别  14-31
  2.1 动作识别算法的研究现状  14-15
  2.2 时空局部特征的检测和描述  15-18
    2.2.1 时空特征检测子  15-17
    2.2.2 时空特征描述子  17-18
  2.3 稀疏编码与矢量量化  18-20
  2.4 基于稀疏编码和局部时空特征的人体动作识别算法  20-22
  2.5 字典训练与迁移学习  22-23
  2.6 多类线性SVM  23-24
  2.7 实验分析  24-29
    2.7.1 参数设置  25
    2.7.2 KTH 数据库上的实验结果  25-27
    2.7.3 UCF 体育数据库上的实验结果  27-28
    2.7.4 字典训练的实验分析  28-29
  2.8 本章小结  29-31
第三章 时空特征学习深度学习  31-47
  3.1 深度学习  32-39
    3.1.1 受限波茨曼机  33-35
    3.1.2 卷积受限波茨曼机  35-39
  3.2 时空深度置信网络(ST-DBN)  39-43
    3.2.1 训练和推断过程  41-43
  3.3 实验分析  43-46
  3.4 本章小结  46-47
第四章 基于非监督贝叶斯轨迹聚类的人群分析  47-62
  4.1 人群分析的研究现状  47-49
  4.2 一种非监督的人群分析方法  49-51
  4.3 基于贝叶斯概率框架的算法模型  51-56
    4.3.1 特征的提取与轨迹跟踪  51-52
    4.3.2 轨迹聚类算法  52-55
    4.3.3 人数计数功能的实现  55-56
  4.4 实验分析  56-60
    4.4.1 实验数据和实验结果  56-59
    4.4.2 误差分析  59-60
  4.5 本章小结  60-62
第五章 总结和展望  62-64
  5.1 全文总结  62-63
  5.2 研究展望  63-64
参考文献  64-71
攻读硕士期间参加的项目  71-72
致谢  72-73
攻读硕士学位期间已发表或录用的论文  73

相似论文

  1. 图像的稀疏表示及编码模型研究,TP391.41
  2. 网络环境下开展学习叙事促进学生深度学习研究,G434
  3. 基于时空关键点的动作识别算法研究,TP391.41
  4. 基于马尔可夫链蒙特卡罗方法的RBM学习算法改进,O211.62
  5. 结合稀疏编码的图像生物视觉特征提取研究,TP391.41
  6. 基于视频的人流检测与分析研究,TP391.41
  7. 基于监督学习的图像局部特征点检测子研究,TP391.41
  8. 基于稀疏表示的高空间分辨率遥感影像纹理描述方法的研究,TP751
  9. 面向图像表达的非负局部坐标分解算法,TP391.41
  10. 基于稀疏非负矩阵分解的图像检索,TP391.41
  11. 基于图的彩色图像目标分割算法研究,TP391.41
  12. 视频监控中目标的行为分析,TP391.41
  13. 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
  14. 在线字典训练及加权差异性稀疏表示的研究,TP391.41
  15. 视频中人体行为识别的判别稀疏编码方法研究,TP391.41
  16. 虚拟架子鼓演示系统的设计与研究,TS953.36
  17. 面向邮件系统的恶意代码检测技术研究,TP393.08
  18. 面向自然场景分类的稀疏编码研究与应用,TP391.41
  19. 关于运动对象轨迹的分割与聚类算法研究,TP311.13
  20. 消防单兵综合信息采集系统研究,TP274.2

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com