学位论文 > 优秀研究生学位论文题录展示

视频对象的自适应提取与视频压缩编码的研究

作 者: 韩传宝
导 师: 王世刚
学 校: 吉林大学
专 业: 电子与通信工程
关键词: 视频对象分割 MPEG-4 精细可分级编码(FGS)
分类号: TN919.81
类 型: 硕士论文
年 份: 2005年
下 载: 279次
引 用: 0次
阅 读: 论文下载
 

内容摘要


目前,数字视频已在许多领域有着广泛的应用,数字电视和高清晰度电视的发展、可视电话的日益普及均说明了这一点。然而用以表示这些视频图像的数据量很大,致使其传输和存储既慢又不经济。为此,必须针对视频图像的特点对数据进行编码与压缩。视频编码近年来已经成为学术界与商业界普遍关注的热点。本文对视频编码的标准和发展进行了详尽的论述,同时阐述了视频对象的提取的发展动态。提出了一种视频对象分割的方法:利用人眼对运动(时间梯度)和边缘(空间梯度)都特别敏感的视觉特点,把帧间运动变化检测和图像的边缘检测结合起来,通过帧间差快速得到运动物体的大致位置,形成差分模板,然后通过边缘检测在差分模板中确定物体的准确边缘,并形成边缘模板。在边缘模板的基础上,利用二值图像下的收缩型活动轮廓算法,可以方便地得到视频对象(vo)的闭合轮廓曲线(以便进行编码传输和基于形状的检索)。同时,设置模板缓冲区以记忆前一时刻的分割结果,从而弥补当前帧的不完整性。该算法对目标的整体运动和局部形变都有较强的适应性,且具有自动消除显露背景以及多目标自动分割包围的能力。在视频对象分割的基础上,对分级编码的相关内容进行了阐述,从而不仅能获得比现有以像素为基础的标准更为优越的压缩性能,也为应用提供了各种新的机遇内容交互的功能。

全文目录


第一章 绪论  7-17
  1.1 视频压缩编码的现状  7-12
    1.1.1 图像视频编码的国际标准  8-12
      1.1.1.1 数字声像存储压缩编码标准MPEG—1  8
      1.1.1.2 数字声像存储压缩编码标准MPEG—2  8-9
      1.1.1.3 视频对象压缩编码标准MPEG—4  9-10
      1.1.1.4 多媒体内容描述接口MPEG-7  10-11
      1.1.1.5 MPEG-21 标准及其应用  11
      1.1.1.6 MPEG 的未来展望  11-12
  1.2 视频运动分割技术的概况  12-15
  1.3 视频压缩编码的发展动态  15-16
  1.4 论文主要章节安排  16-17
第二章 视频对象的自适应提取  17-32
  2.1 视频分割方法  17-30
    2.1.1 运动估计和补偿  17-18
    2.1.2 图像差分噪声的消除  18-20
    2.1.3 边缘检测  20-21
    2.1.4 初始模版  21
    2.1.5 VOP 的提取  21-27
      2.1.5.1 控制点重新分配  22
      2.1.5.2 平滑  22-23
      2.1.5.3 收缩  23-24
      2.1.5.4 粘定  24-25
      2.1.5.5 分裂  25-26
      2.1.5.6 收敛标准  26-27
    2.1.6 模板缓冲区更新  27-30
      2.1.6.1 估计整体运动矢量V  28
      2.1.6.2 新的边缘缓冲区Mt  28-29
      2.1.6.3 剔除背景像素  29-30
  2.2 实验结果和分析  30-32
第三章 视频压缩编码  32-50
  3.1 视频压缩编码技术路线  32-35
  3.2 分级扩展编码  35-41
  3.3 形状编码  41-42
  3.4 运动信息编码  42
  3.5 纹理编码  42-43
  3.6 Sprite 编码  43-44
  3.7 差错控制方式  44-45
    3.7.1 可逆变长编码  44-45
    3.7.2 重同步标志  45
    3.7.3 数据分割  45
    3.7.4 头扩展码  45
  3.8 实验结果和分析  45-50
第四章 本文总结  50-51
参考文献  51-54
摘要  54-59
ABSTRACT  59-63
致谢  63-64
导师及作者简介  64

相似论文

  1. 高效三维视频表达及编码技术研究与开发,TN919.81
  2. 载姜黄素MPEG-P(CL-co-PDO)聚合物胶束的研究,R283
  3. 基于TILE Pro64多核处理器的3G服务器视频转码软件设计,TP393.05
  4. 时空融合的视觉选择注意模型及其在MPEG压缩域应用研究,TP391.41
  5. 基于广义组合多核高斯函数的图像分类方法研究,TP391.41
  6. 基于ASON的高速公路视频监控系统应用研究,TP277
  7. 基于压缩域特征的视频检索技术研究,TP391.41
  8. 基于MPEG-4的运动目标检测技术研究,TP391.41
  9. 基于运动矢量的视频水印算法,TP309.7
  10. 基于本体的监控视频描述与检索研究及流媒体发布平台开发,TN919.8
  11. 基于音频词袋和MPEG-7特征的暴力视频快速分类算法研究,TP391.41
  12. 基于802.11网络的无线视频传输系统设计,TN919.8
  13. 基于MPEG-2标准的音视频同步实现,TN949.197
  14. 聚乙二醇化的VLA-4拮抗肽对哮喘小鼠气道上皮Eotaxin和CCR3表达的影响,R562.25
  15. 基于Web的煤矿视频监控系统的研究与开发,TP277
  16. 酒钢生产指挥中心数字监控系统的设计与实现,TP277
  17. 基于形态学的图像分割方法的研究与应用,TP391.41
  18. 基于MPEG-2的视频数字水印的研究与实现,TP309.7
  19. 边防部队勤务监管与指挥调度系统的设计与实现,TP311.52
  20. 基于MPEG-4的视频水印技术的研究与实现,TP309
  21. 一种DCT域数字视频水印技术研,TP309.7

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com