学位论文 > 优秀研究生学位论文题录展示

基于运动信息的二维到三维视频转换技术研究

作 者: 陈铭
导 师: 赵志杰
学 校: 哈尔滨商业大学
专 业: 计算机应用技术
关键词: 二维到三维视频转换 深度图 运动补偿时域滤波 三维视频编码
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 65次
引 用: 0次
阅 读: 论文下载
 

内容摘要


三维显示是将来信息的一种重要表现方式。随着三维视频的迅速发展,目前三维显示设备市场存在着立体显示设备的快速普及和三维资源的缺乏的显著矛盾。为了解决该矛盾,一方面三维媒体资源可以通过三维摄像设备获取,如立体摄像机;另一方面,现有的大量二维媒体资源可以转换为三维媒体资源。如果给出一套二维到三维视频转换的解决方案,不但可以解决三维媒体资源的匮乏问题,而且可以避免浪费现有的二维媒体资源。在查阅国内外大量相关文献的基础上,总结了二维到三维视频转换的各种方案。阐述了基于光流法、块匹配法等实现二维到三维视频转换原理。详细介绍了利用变宏块运动估计获得深度图的实现方法。在利用运动矢量生成深度图的过程中,通过对运动矢量场的分析,获得了背景的整体运动矢量。给出了基于运动矢量场分析的运动背景调整方法。该方法去除了背景区域错误深度信息,使前景对象深度更为准确。在宏块级的深度图生成后,通过对帧间运动补偿时域滤波后高通帧系数与像素匹配程度的分析,提出了基于像素匹配的深度调整算法。并利用该调整算法对宏块级深度图进行校正。该调整算法通过区分对象边缘的宏块中的前景像素与背景像素,获得像素级的深度图。然后,采用形态学中的膨胀腐蚀算法对消除个别离散的噪声点与孔洞,得到最终的深度图像。实验验证,该方法能够有效的提高深度图精度。为适应三维视频异构网络环境的信号传输。提出了基于小波的深度补偿时域滤波实现三维可伸缩视频编码方法。针对二维+深度图的三维视频的特点,建立三维视频的时间、空间与质量可伸缩的实现方案。并进行了实验验证。

全文目录


摘要  5-6
Abstract  6-11
1 绪论  11-15
  1.1 课题研究的目的和意义  11-12
  1.2 二维到三维视频转换研究现状  12-14
  1.3 课题的主要内容  14
  1.4 论文总体结构  14-15
2 二维到三维视频转换技术  15-26
  2.1 运动估计  15-20
    2.1.1 光流法  16-17
    2.1.2 块匹配法  17-20
  2.2 初始深度图生成  20-21
    2.2.1 初始深度值生成方法  20-21
    2.2.2 动态背景调整  21
  2.3 基于帧间像素匹配的深度调整方法  21-22
  2.4 深度图滤波  22-23
  2.5 三维视频合成  23-25
  2.6 三维可伸缩视频编码  25
  2.7 本章小结  25-26
3 基于像素匹配的深度调整方法  26-33
  3.1 现有深度生成方法分析  26-27
  3.2 运动补偿时域滤波  27-29
  3.3 基于帧间像素匹配的深度调整算法  29-32
    3.3.1 预测帧中像素点能在参考帧中找到唯一对应的点  29-31
    3.3.2 预测帧中多个像素对应参考帧中同一点  31
    3.3.3 预测帧中像素点在参考帧中找不到对应点  31-32
    3.3.4 参考帧中像素点在预测帧中找不到对应点  32
  3.4 本章小结  32-33
4 三维可伸缩视频编码  33-42
  4.1 三维可伸缩视频编码总体结构  33-34
  4.2 时域分解  34-37
    4.2.1 运动补偿时域滤波  34-35
    4.2.2 深度补偿时域滤波  35-37
  4.3 空间分解  37-39
    4.3.1 二维小波变换  37-38
    4.3.2 帧内小波编码基本框架  38-39
  4.4 小波系数量化  39-40
  4.5 三维视频的可伸缩与解码  40-41
  4.6 本章小结  41-42
5 系统方案的设计与实现  42-48
  5.1 系统总体设计方案  42
  5.2 运动估计  42-43
  5.3 深度图滤波  43
  5.4 深度可伸缩编码及可伸缩参数  43-44
  5.5 深度图生成结果  44-45
  5.6 三维可伸缩编码实验结果  45-47
    5.6.1 深度帧编解码与可伸缩实验结果  45-46
    5.6.2 可伸缩三维视频编解码实验结果  46-47
  5.7 本章小结  47-48
结论  48-49
参考文献  49-53
攻读学位期间发表的学术论文  53-54
致谢  54

相似论文

  1. 融合深度图和三维模型的人体运动捕捉技术研究,TP391.41
  2. 自由视点视频系统中深度场的处理和任意视点的绘制,TP391.41
  3. 基于图形变形和深度图的多视点立体图像中间虚拟视点的生成,TP391.41
  4. 多视点立体图像的深度提取及虚拟视点生成研究,TP391.41
  5. 基于运动补偿时域滤波可伸缩视频编码研究,TN919.81
  6. 单侧视点合成方法研究及其在多视点视频编码中的应用,TN919.81
  7. 稀疏深度图匹配关键技术研究,TP391.41
  8. 三维重建系统的关键技术研究,TP391.41
  9. 基于深度图的三维脚型重建系统,TP391.41
  10. 基于双目立体视觉的目标跟踪方法研究,TP391.41
  11. 基于内容的多视点视频编码,TN919.81
  12. 车牌定位技术的研究,TP391.41
  13. 三维激光数据快速配准与绘制,TP391.41
  14. 基于CS理论的超分辨率深度图重建研究与摄像机阵列的研制,TP391.41
  15. 单目视频中深度图生成算法研究,TP391.41
  16. 三维面貌特征提取与识别技术研究,TP399
  17. 模糊小波算法在啤酒质量检测中的应用,TP274.4
  18. 工程机器人立体视觉系统研究,TP242
  19. 基于双目立体视觉的距离测量,TP274.4
  20. 工程机器人立体视觉技术研究,TP242

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com