学位论文 > 优秀研究生学位论文题录展示
基于多摄像机的人体运动跟踪与分析
作 者: 孙洛
导 师: 徐光祐
学 校: 清华大学
专 业: 计算机科学与技术
关键词: 人体运动跟踪 人体运动分析 多摄像机 上下文
分类号: TP391.41
类 型: 博士论文
年 份: 2010年
下 载: 111次
引 用: 0次
阅 读: 论文下载
内容摘要
人体运动跟踪和分析不仅是计算机视觉研究的重点问题之一,更是“以人为中心”计算的关键技术,具有广阔的应用前景。本文研究基于多摄像机的人体运动跟踪和分析方法,提出了新的多摄像机环境下的人体定位和姿态跟踪算法;在此基础上,提出将人体运动信息按照精细程度和语义结构划分为若干层次,利用上下文(Context)模型将不同层次的运动信息有效结合起来,实现有选择性、以任务为导向的人体运动跟踪与分析。论文研究内容包括:(1)通过充分利用多视角环境下竖直线地面投影的共点性约束,提出了一种快速鲁棒的基于多视角的人体定位与高度测量算法。本算法无需复杂的摄像机姿态标定,无需对人体特定部分的可见性做出假设。在多个真实场景下的实验结果表明,本算法具有易于部署和标定、无系统误差、快速鲁棒的特点;(2)以人体的头肩部轮廓构成的?形状的曲线作为跟踪目标,提出了一种多视角下人体朝向、位置和头肩部轮廓的联合跟踪算法,将多视角头肩部轮廓跟踪和三维空间中的头肩部位置跟踪、朝向检测融合于同一框架中。实验表明本文算法对于复杂人体运动,都能够准确鲁棒地跟踪人体位置、朝向和头肩部轮廓。(3)提出了基于上下文的人体运动跟踪和分析框架,建立了相应的上下文模型,实现了由粗到精的、以任务为导向的多层次人体运动信息融合。实验表明,上下文在人体运动跟踪和分析中分析发挥了积极的作用,降低了信息处理系统负载,同时提高了结果精度和鲁棒性。(4)通过分析觉察上下文环境下分布式多媒体系统的共同特点,提出并实现了一个通用的系统框架,该框架不仅能够支持分布式多媒体系统的构建和运行,还能够有效管理系统中出现的各种上下文信息,具有良好的可扩展性。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 引言 9-18 1.1 研究背景 9-11 1.2 研究内容 11-15 1.3 研究现状 15-17 1.4 本文结构组织 17-18 第2章 多摄像机快速人体定位算法 18-31 2.1 本章引论 18-19 2.2 多摄像机环境下的几何约束 19-22 2.3 多摄像机人体定位算法 22-25 2.4 实验结果 25-30 2.5 小结 30-31 第3章 多摄像机人体姿态跟踪 31-71 3.1 本章引论 31-34 3.2 多视角轮廓约束 34-38 3.2.1 位置约束 34-36 3.2.2 形状约束 36-38 3.3 头肩部轮廓的形状表示和概率模型 38-50 3.3.1 非线性数据降维 39-40 3.3.2 状态空间的MFA 模型 40-41 3.3.3 训练数据的获取和训练结果 41-50 3.4 多视角联合跟踪模型 50-59 3.4.1 基于粒子滤波器的多摄像机头肩部轮廓跟踪算法 54-57 3.4.2 基于动态贝叶斯网的头肩部定位和朝向估计算法 57-58 3.4.3 参数训练 58-59 3.5 度量表示与图象度量模型 59-60 3.6 联合跟踪算法的自动初始化 60-62 3.7 实验结果分析 62-69 3.8 本章小结 69-71 第4章 基于上下文的人体运动跟踪与分析 71-96 4.1 本章引论 71-74 4.2 支持人体运动跟踪与分析的上下文模型 74-76 4.3 实验场景 76-78 4.4 视角无关的手部特征 78-84 4.4.1 特征提取 79-83 4.4.2 手部姿态分类和实验结果 83-84 4.5 场景上下文推理 84-86 4.6 上下文指导人体运动分析 86-90 4.7 实验结果分析 90-95 4.8 本章小节 95-96 第5章 支持觉察上下文计算的分布式多媒体系统框架 96-114 5.1 框架结构 97-100 5.2 软件平台 100-103 5.2.1 分层服务结构 100-102 5.2.2 后台服务进程 102-103 5.3 上下文信息系统 103-110 5.3.1 整体结构 104-106 5.3.2 上下文表述 106-108 5.3.3 基于XML 的上下文存储 108-110 5.4 框架性能测试 110-113 5.5 本章小结 113-114 第6章 结论与展望 114-117 参考文献 117-125 致谢 125-126 个人简历、在学期间发表的学术论文与研究成果 126-127
|
相似论文
- 上下文相关的词汇复述研究,TP391.1
- 面向统计机器翻译的解码算法的研究,TP391.2
- 基于移动IPv6网络的QoS上下文转移技术研究,TN929.5
- 多摄像机视频监控中基于几何约束的目标匹配技术研究,TP391.41
- 基于空间邻域词袋模型的图像标注技术,TP391.41
- 泛在网络下终端聚合过程中环境上下文的研究,TN929.5
- 普适计算中上下文推理及不一致性检测技术的研究,TP391.1
- 基于条件随机场的RNA二级结构预测算法,R346
- 基于社会上下文约束和物品上下文约束的协同推荐,TP391.3
- 基于字词联合解码的中文分词研究,TP391.1
- 面向虚拟展示的室内三维场景快速构建与优化技术研究,TP391.41
- 基于可比较语料库双语多词表达式对抽取,TP391.1
- 基于模型的人体运动分析,TP391.41
- 基于RFID的上下文感知若干关键技术研究,TP391.1
- 分布式多视角目标跟踪的统计推理方法及实现,TP391.41
- 复杂场景下的视觉目标跟踪方法研究,TP391.41
- 面向上下文感知计算的反射技术研究,TP391.1
- 支持不确定性推理的上下文模型构建和基于贝叶斯网络的推理,TP391.1
- 基于概念上下文的本体匹配算法研究,TP391.1
- 基于特征和灰度的非刚性医学图像配准方法研究,TP391.41
- 局部描述特征结合概率潜在语义模型的场景分类技术研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|