学位论文 > 优秀研究生学位论文题录展示

面向人机交互的单目视频三维人体姿态估计研究

作 者: 李娜
导 师: 陈纯
学 校: 浙江大学
专 业: 计算机科学与技术
关键词: 姿态估计 三维人体 人体运动 图像特征 人机交互设计 博士学位论文 色彩空间 判别模型 浙江大学 人体部位
分类号: TP391.41
类 型: 博士论文
年 份: 2008年
下 载: 724次
引 用: 2次
阅 读: 论文下载
 

内容摘要


自动理解图像或者视频序列中的运动人体,一直是计算机视觉研究的重点。除了人类对通过机器探索和仿造自身的兴趣外,促使其成为研究热点的一个重要原因是电子设备的迅猛发展和由其带来的巨大应用市场。本文针对人机交互应用,着重研究单目视频下三维人体姿态估计。单目视频三维人体姿态估计是计算机视觉研究中最具挑战性的问题之一。系统的观测输入为复杂自然图像,状态输出为高维人体姿态,由观测到状态的系统过程是动态且非线性的。此外,面向人机交互应用时,单目视频三维人体姿态估计系统的核心算法需同时满足准确、鲁棒和实时性要求,系统初始化过程应尽可能自动化。针对以上问题,本文依照模块分别展开研究,并将各部分算法集成至人机交互原型系统,从而实现基于单目视频三维人体姿态估计的人机交互。本文将单目视频三维人体姿态估计研究划分为三部分关键技术:图像特征提取、人体姿态估计算法以及初始化过程的自动化。其中,图像特征提取研究针对普通低端摄像设备,提出了基于HSV色彩空间的图像特征提取算法,通过采用与人眼视觉感知一致的HSV空间提高图像特征提取的有效性和鲁棒性。针对人体姿态估计算法,本文提出了判别模型和生成模型相结合的三维人体姿态估计数学模型。通过判别模型确定目标姿态的子空间,进而通过生成模型求解目标姿态,充分发挥了判别式模型和生成式模型各自的优势。针对系统初始化过程,本文重点介绍了手工分割视频对象的框架和评价标准,为用户辅助采集训练数据提供便利,减少用户在系统初始化过程中的交互工作量。根据以上核心算法设计,本文自行开发了基于肢体运动控制的新式人机交互实时系统。为验证系统的有效性,本文进一步开发了一款使用普通网络摄像头交互的简易游戏,为探讨基于人体运动人机交互设计方法建立了实验平台。通过该平台,本文进行大量用户测试,并探讨这种新型人机交互在全新设计环境下面临的问题和机遇。测试结果表明了本文所提出的单目三维人体姿态估计系统的有效性,同时展示了此类基于人体运动的新型交互系统的独特魅力和广阔应用前景。

全文目录


致谢  5-6
摘要  6-7
Abstract  7-14
第1章 绪论  14-22
  1.1 引言  14-15
  1.2 人体运动视频分析的研究意义  15-16
  1.3 人体运动视频分析的研究要点和难点  16-18
  1.4 论文的主要工作  18-20
    1.4.1 论文主要内容  19-20
    1.4.2 论文的主要创新点  20
  1.5 论文结构  20-22
第2章 文献综述  22-40
  2.1 运动人体的检测  22-23
  2.2 运动人体的行为识别  23-26
  2.3 基于人体运动的人机交互  26-28
  2.4 人体姿态估计的研究现状  28-39
    2.4.1 人体姿态的表达模型  29-30
    2.4.2 人体姿态估计系统的初始化技术  30-32
    2.4.3 多目视频的人体姿态估计  32-33
    2.4.4 单目视频的人体姿态估计  33-39
  2.5 本文的方法特点  39
  2.6 本章小结  39-40
第3章 基于HSV色彩空间图像特征  40-60
  3.1 人体运动视频的图像特征  40-41
  3.2 人类视觉系统与色彩空间  41-44
    3.2.1 人类视觉系统的特性基础  41-42
    3.2.2 色彩空间综述  42
    3.2.3 HSV和HSL色彩空间  42-43
    3.2.4 图像特征与色彩空间的选取  43-44
  3.3 基于HSV的运动前景分割  44-49
    3.3.1 自动视频对象分割  44-45
    3.3.2 前景对象分割算法  45-49
    3.3.3 视频前景分割算法描述  49
  3.4 基于HSV的感兴趣区域检测  49-54
    3.4.1 感兴趣区域检测  49-50
    3.4.2 基于HSV空间的广义不变矩描述子  50-52
    3.4.3 通过积分图计算广义不变矩  52-54
    3.4.4 感兴趣区域检测算法描述  54
  3.5 实验和结果分析  54-59
    3.5.1 视频前景对象分割实验结果  54-57
    3.5.2 感兴趣区域检测实验结果  57-59
  3.6 本章小结  59-60
第4章 弱标记的单目三维姿态估计  60-76
  4.1 弱标记系统  60-61
    4.1.1 弱标记的必要性  60
    4.1.2 弱标记的选取  60-61
  4.2 基于样例的算法框架  61-63
    4.2.1 基于样例的算法特点  61-62
    4.2.2 基于弱标记和样例的算法流程  62-63
    4.2.3 本章数学符号介绍  63
  4.3 三维姿态样例数据库的索引和检索  63-69
    4.3.1 数据组织算法概述  63-64
    4.3.2 基于空间划分选取近似近邻  64-66
    4.3.3 基于图像着色的索引  66-67
    4.3.4 样例数据库索引和检索算法  67-69
  4.4 通过相关样例的三维姿态生成  69-71
    4.4.1 相关样例的空间局部线性  69
    4.4.2 通过最大后验概率生成三维姿态  69-70
    4.4.3 最大后验概率模型的求解  70-71
  4.5 实验和结果分析  71-75
    4.5.1 近似近邻与最近邻的比较  71
    4.5.2 检索弱标记相关样例的结果  71-73
    4.5.3 优化的三维人体姿态结果  73-75
  4.6 本章小结  75-76
第5章 无标记的单目三维姿态估计  76-94
  5.1 基于层次结构的判别-生成混合模型  76-80
    5.1.1 判别模型和生成模型介绍  76-77
    5.1.2 从部位到整体的姿态估计层次结构  77-79
    5.1.3 基于层次结构的判别-生成混合模型  79-80
    5.1.4 本章数学符号介绍  80
  5.2 通过贝叶斯匹配识别部位姿态  80-85
    5.2.1 贝叶斯匹配的动机和基本思想  80-81
    5.2.2 基于聚类的识别  81-82
    5.2.3 通过贝叶斯匹配识别部位姿态  82-83
    5.2.4 图像观测与似然概率  83-84
    5.2.5 贝叶斯匹配算法小结  84-85
  5.3 由部位姿态构造整体姿态的局部空间  85-86
    5.3.1 通过能力最小化合成整体姿态  85-86
    5.3.2 部位间组合方式  86
    5.3.3 局部空间的PCA降维  86
  5.4 基于贝叶斯EM算法优化整体姿态  86-90
    5.4.1 贝叶斯推断与EM算法  86-87
    5.4.2 基于BEM的三维姿态估计  87-88
    5.4.3 期望和最大化的计算  88-89
    5.4.4 BEM算法总结  89-90
  5.5 实验和结果分析  90-92
    5.5.1 部位姿态的识别结果  90-91
    5.5.2 部位到整体的合成结果  91
    5.5.3 整体姿态的优化结果  91-92
  5.6 本章小结  92-94
第6章 系统初始化技术  94-104
  6.1 系统初始化过程介绍  94-96
    6.1.1 人体姿态估计系统的初始化技术  94-96
  6.2 交互式视频对象分割  96-101
    6.2.1 多次扫描的交互式分割系统  96-97
    6.2.2 双向跟踪  97
    6.2.3 基于推广智能剪刀的分割  97-99
    6.2.4 视频对象分割结果的评价  99-101
  6.3 实验和结果分析  101-103
    6.3.1 智能剪刀交互分割的结果  101
    6.3.2 多次扫描的交互对象分割结果  101-102
    6.3.3 多准则分割评价的结果  102-103
  6.4 本章小结  103-104
第7章 人机交互系统实现与用户测试  104-114
  7.1 基于姿态估计的人机交互系统  104-105
  7.2 交互平台的搭建  105-106
    7.2.1 系统平台  105
    7.2.2 游戏介绍  105-106
  7.3 交互方法的设计与实现  106-109
    7.3.1 基于摄像头的交互  106
    7.3.2 相关工作简介  106-107
    7.3.3 用户与虚拟角色的无缝分离  107-109
  7.4 用户测试及结果分析  109-113
    7.4.1 用户测试设计  109-110
    7.4.2 用户测试结果  110-112
    7.4.3 结果分析与讨论  112-113
  7.5 本章小结  113-114
第8章 总结与展望  114-116
  8.1 本文总结  114-115
  8.2 研究工作展望  115-116
参考文献  116-127
攻读博士学位期间的成果  127-128
个人简历  128

相似论文

  1. 有标记点的人体三维运动数据获取方法的研究,TP391.41
  2. 立体视觉里程计中的空间不确定度,TP391.41
  3. 基于人体运动传感的个人定位方法及系统实现,TN95
  4. 基于高斯特征的人体运动情感识别研究,TP391.41
  5. 基于特征的图像瑕疵检测算法研究与应用,TP391.41
  6. 融合深度图和三维模型的人体运动捕捉技术研究,TP391.41
  7. DALI住宅照明系统的工业设计,TM923
  8. 利用Kinect估计人体头部姿态,TP391.41
  9. 人体运动序列数据的语义化分析方法研究,TP391.1
  10. 基于图像特征提取的图像融合研究,TP391.41
  11. 利用小波变换与优化截断的嵌入式块编码进行图像压缩,TP391.41
  12. 基于稀疏表示的人体运动捕获数据分析方法研究,TP391.41
  13. 基于三维人体测量的女性下装人台研究,TS941.17
  14. 基于模式识别方法的天气雷达数字产品的监控与分析,TN959.4
  15. 基于分割一致性的二维人体姿态估计,TP391.41
  16. 基于模型的人体运动分析,TP391.41
  17. 基于图像的三维人体建模技术研究,TP391.41
  18. 武汉地区男子足球运动员体型分析及原型自动生成模型建立,G843
  19. 智能家居照明控制系统研究,TP273.5
  20. 图像配准技术与优化算法研究,TP391.41
  21. 基于模型的人体运动跟踪和姿态分析技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com