学位论文 > 优秀研究生学位论文题录展示

面向人机交互的单目视频三维人体姿态估计研究

作　者: 李娜
导　师: 陈纯
学　校: 浙江大学
专　业: 计算机科学与技术
关键词: 姿态估计三维人体人体运动图像特征人机交互设计博士学位论文色彩空间判别模型浙江大学人体部位
分类号: TP391.41
类　型: 博士论文
年　份: 2008年
下　载: 724次
引　用: 2次
阅　读: 论文下载

内容摘要

自动理解图像或者视频序列中的运动人体,一直是计算机视觉研究的重点。除了人类对通过机器探索和仿造自身的兴趣外,促使其成为研究热点的一个重要原因是电子设备的迅猛发展和由其带来的巨大应用市场。本文针对人机交互应用,着重研究单目视频下三维人体姿态估计。单目视频三维人体姿态估计是计算机视觉研究中最具挑战性的问题之一。系统的观测输入为复杂自然图像,状态输出为高维人体姿态,由观测到状态的系统过程是动态且非线性的。此外,面向人机交互应用时,单目视频三维人体姿态估计系统的核心算法需同时满足准确、鲁棒和实时性要求,系统初始化过程应尽可能自动化。针对以上问题,本文依照模块分别展开研究,并将各部分算法集成至人机交互原型系统,从而实现基于单目视频三维人体姿态估计的人机交互。本文将单目视频三维人体姿态估计研究划分为三部分关键技术:图像特征提取、人体姿态估计算法以及初始化过程的自动化。其中,图像特征提取研究针对普通低端摄像设备,提出了基于HSV色彩空间的图像特征提取算法,通过采用与人眼视觉感知一致的HSV空间提高图像特征提取的有效性和鲁棒性。针对人体姿态估计算法,本文提出了判别模型和生成模型相结合的三维人体姿态估计数学模型。通过判别模型确定目标姿态的子空间,进而通过生成模型求解目标姿态,充分发挥了判别式模型和生成式模型各自的优势。针对系统初始化过程,本文重点介绍了手工分割视频对象的框架和评价标准,为用户辅助采集训练数据提供便利,减少用户在系统初始化过程中的交互工作量。根据以上核心算法设计,本文自行开发了基于肢体运动控制的新式人机交互实时系统。为验证系统的有效性,本文进一步开发了一款使用普通网络摄像头交互的简易游戏,为探讨基于人体运动的人机交互设计方法建立了实验平台。通过该平台,本文进行大量用户测试,并探讨这种新型人机交互在全新设计环境下面临的问题和机遇。测试结果表明了本文所提出的单目三维人体姿态估计系统的有效性,同时展示了此类基于人体运动的新型交互系统的独特魅力和广阔应用前景。

全文目录

致谢  5-6
摘要  6-7
Abstract  7-14
第1章绪论  14-22
  1.1 引言  14-15
  1.2 人体运动视频分析的研究意义  15-16
  1.3 人体运动视频分析的研究要点和难点  16-18
  1.4 论文的主要工作  18-20
    1.4.1 论文主要内容  19-20
    1.4.2 论文的主要创新点  20
  1.5 论文结构  20-22
第2章文献综述  22-40
  2.1 运动人体的检测  22-23
  2.2 运动人体的行为识别  23-26
  2.3 基于人体运动的人机交互  26-28
  2.4 人体姿态估计的研究现状  28-39
    2.4.1 人体姿态的表达模型  29-30
    2.4.2 人体姿态估计系统的初始化技术  30-32
    2.4.3 多目视频的人体姿态估计  32-33
    2.4.4 单目视频的人体姿态估计  33-39
  2.5 本文的方法特点  39
  2.6 本章小结  39-40
第3章基于HSV色彩空间的图像特征  40-60
  3.1 人体运动视频的图像特征  40-41
  3.2 人类视觉系统与色彩空间  41-44
    3.2.1 人类视觉系统的特性基础  41-42
    3.2.2 色彩空间综述  42
    3.2.3 HSV和HSL色彩空间  42-43
    3.2.4 图像特征与色彩空间的选取  43-44
  3.3 基于HSV的运动前景分割  44-49
    3.3.1 自动视频对象分割  44-45
    3.3.2 前景对象分割算法  45-49
    3.3.3 视频前景分割算法描述  49
  3.4 基于HSV的感兴趣区域检测  49-54
    3.4.1 感兴趣区域检测  49-50
    3.4.2 基于HSV空间的广义不变矩描述子  50-52
    3.4.3 通过积分图计算广义不变矩  52-54
    3.4.4 感兴趣区域检测算法描述  54
  3.5 实验和结果分析  54-59
    3.5.1 视频前景对象分割实验结果  54-57
    3.5.2 感兴趣区域检测实验结果  57-59
  3.6 本章小结  59-60
第4章弱标记的单目三维姿态估计  60-76
  4.1 弱标记系统  60-61
    4.1.1 弱标记的必要性  60
    4.1.2 弱标记的选取  60-61
  4.2 基于样例的算法框架  61-63
    4.2.1 基于样例的算法特点  61-62
    4.2.2 基于弱标记和样例的算法流程  62-63
    4.2.3 本章数学符号介绍  63
  4.3 三维姿态样例数据库的索引和检索  63-69
    4.3.1 数据组织算法概述  63-64
    4.3.2 基于空间划分选取近似近邻  64-66
    4.3.3 基于图像着色的索引  66-67
    4.3.4 样例数据库索引和检索算法  67-69
  4.4 通过相关样例的三维姿态生成  69-71
    4.4.1 相关样例的空间局部线性  69
    4.4.2 通过最大后验概率生成三维姿态  69-70
    4.4.3 最大后验概率模型的求解  70-71
  4.5 实验和结果分析  71-75
    4.5.1 近似近邻与最近邻的比较  71
    4.5.2 检索弱标记相关样例的结果  71-73
    4.5.3 优化的三维人体姿态结果  73-75
  4.6 本章小结  75-76
第5章无标记的单目三维姿态估计  76-94
  5.1 基于层次结构的判别-生成混合模型  76-80
    5.1.1 判别模型和生成模型介绍  76-77
    5.1.2 从部位到整体的姿态估计层次结构  77-79
    5.1.3 基于层次结构的判别-生成混合模型  79-80
    5.1.4 本章数学符号介绍  80
  5.2 通过贝叶斯匹配识别部位姿态  80-85
    5.2.1 贝叶斯匹配的动机和基本思想  80-81
    5.2.2 基于聚类的识别  81-82
    5.2.3 通过贝叶斯匹配识别部位姿态  82-83
    5.2.4 图像观测与似然概率  83-84
    5.2.5 贝叶斯匹配算法小结  84-85
  5.3 由部位姿态构造整体姿态的局部空间  85-86
    5.3.1 通过能力最小化合成整体姿态  85-86
    5.3.2 部位间组合方式  86
    5.3.3 局部空间的PCA降维  86
  5.4 基于贝叶斯EM算法优化整体姿态  86-90
    5.4.1 贝叶斯推断与EM算法  86-87
    5.4.2 基于BEM的三维姿态估计  87-88
    5.4.3 期望和最大化的计算  88-89
    5.4.4 BEM算法总结  89-90
  5.5 实验和结果分析  90-92
    5.5.1 部位姿态的识别结果  90-91
    5.5.2 部位到整体的合成结果  91
    5.5.3 整体姿态的优化结果  91-92
  5.6 本章小结  92-94
第6章系统初始化技术  94-104
  6.1 系统初始化过程介绍  94-96
    6.1.1 人体姿态估计系统的初始化技术  94-96
  6.2 交互式视频对象分割  96-101
    6.2.1 多次扫描的交互式分割系统  96-97
    6.2.2 双向跟踪  97
    6.2.3 基于推广智能剪刀的分割  97-99
    6.2.4 视频对象分割结果的评价  99-101
  6.3 实验和结果分析  101-103
    6.3.1 智能剪刀交互分割的结果  101
    6.3.2 多次扫描的交互对象分割结果  101-102
    6.3.3 多准则分割评价的结果  102-103
  6.4 本章小结  103-104
第7章人机交互系统实现与用户测试  104-114
  7.1 基于姿态估计的人机交互系统  104-105
  7.2 交互平台的搭建  105-106
    7.2.1 系统平台  105
    7.2.2 游戏介绍  105-106
  7.3 交互方法的设计与实现  106-109
    7.3.1 基于摄像头的交互  106
    7.3.2 相关工作简介  106-107
    7.3.3 用户与虚拟角色的无缝分离  107-109
  7.4 用户测试及结果分析  109-113
    7.4.1 用户测试设计  109-110
    7.4.2 用户测试结果  110-112
    7.4.3 结果分析与讨论  112-113
  7.5 本章小结  113-114
第8章总结与展望  114-116
  8.1 本文总结  114-115
  8.2 研究工作展望  115-116
参考文献  116-127
攻读博士学位期间的成果  127-128
个人简历  128

面向人机交互的单目视频三维人体姿态估计研究

内容摘要

全文目录

相似论文