学位论文 > 优秀研究生学位论文题录展示

实时H.264关键编码算法研究与实现

作　者: 成运
导　师: 王志英
学　校: 国防科学技术大学
专　业: 计算机科学与技术
关键词: H.264 实时编码运动估计模式选择多参考帧选择
分类号: TN919.81
类　型: 博士论文
年　份: 2006年
下　载: 981次
引　用: 5次
阅　读: 论文下载

内容摘要

H.264是由ITU-T VCEG和ISO/IEC MPEG联合推出的新一代国际视频编码标准,它采用的依然是基于块的运动补偿和变换的混合编码方案,但和其它视频编码标准相比,它采用了一种全新的近似DCT变换技术——整数变换技术以避免以前标准中使用DCT变换所带来的反变换匹配误差,采用帧内预测编码以提高帧内及帧间编码效率,帧间采用灵活多变的不同块大小来准确描述物体的实际运动情况,且使用了高精度的分数像素运动估计与补偿以及多参考帧选择技术来增加预测的准确度,采用自适应滤波器以去除图像的边界效应,采用基于上下文的二进制编码技术以缩减编码所需的位数等等,这些新技术的综合运用使得H.264编码器和以前的视频编码标准相比在同等重建图像质量下能够节约大约50%的码率,但H.264编码器所使用的新技术也直接导致了其实现的高复杂性,从而限制了其在实时领域里的应用,因此,如何以较低的实现复杂度获得较高的编码效率就成了H.264视频编码技术走向实时应用的一个重要研究课题。为了追求高效率的编码效果,H.264所采用的新的编码技术中使用了大量复杂度极高的编码算法,这些算法的使用直接制约着H.264编码器在实时视频编码领域里的应用,因此,必须寻找相应的快速实现算法来替代H.264中那些复杂度极高的算法;同时为了进一步提高H.264的编码速度,除了对算法进行优化以外,还可以对编码器中反复使用的一些功能模块根据平台的特点进行指令级的优化,此外,还可以根据实际需要对整个H.264编码器的程序结构和数据结构进行适当的优化,本文依据这一思路对H.264编码器中所使用的部分关键算法进行了比较深入的研究并结合平台特点进行了实现,取得了较好的加速效果,主要创新点体现在:●从理论上解决了对H.264中的零块进行精确检测的问题。针对H.264中整数变换与量化的特点对H.264中的零块判决技术进行了深入研究,推导出了H.264中的最佳零块判决阈值计算公式。●提出了三个运动搜索模板以及两种快速整像素运动估计算法。针对运动估计的复杂性,提出可以在整像素运动估计过程使用三角形模板、线性模板或简化正方形模板对大运动矢量进行粗定位,并在此基础上提出了两种快速整像素运动估计算法——基于菱形—三角形模板的快速运动估计算法DTS(Diamond Triangle Search)和基于菱形—简化正方形模板的快速运动估计算法DSSS(Diamond Simplified Square Search)。●提出了一种快速的多参考帧选择算法。针对多参考帧选择算法的复杂性,根据运动强度和参考帧率失真优化值所表现出来的单调性提出的快速多参考帧选择算法可以有效地减少参考帧判决数目。●提出了一种利用新的码字结构进行变长编码方案——商—余数编码方案,使用该编码方案可以有效减少H.264视频编码的长度。作者最后还把本人提出的上述有关算法综合运用到H.264编码器中,在参考软件JM7.6框架下对程序与数据结构进行了适当优化,并对一些关键模块如整像素运动估计中求残差的绝对误差和SAD,分数像素运动估计中求残差的Hadamard变换及对变换后的残差矩阵求取绝对值和SATD,整数变换及其逆变换,亚像素内插等模块利用PC机的多媒体指令系统进行指令级优化,同时对编码器进行总体优化,取得了比较满意的加速效果,实验结果表明:使用了总体结构优化、算法优化和平台优化之后,基本可以在通用微处理器平台PC上对QCIF格式的视频序列进行实时H.264编码。

全文目录

摘要  13-15
ABSTRACT  15-17
第一章绪论  17-31
  1.1 视频编码技术的发展  17-23
    1.1.1 概述  17-19
    1.1.2 常用图像视频编码方法的分类  19-20
    1.1.3 基本编码方法  20-21
    1.1.4 图像质量评价体系  21-23
  1.2 视频编码标准简介  23-25
  1.3 H.264视频编码标准的提出及特点  25-27
  1.4 H.264编码算法研究现状  27-29
    1.4.1 国外研究现状简介  27-28
    1.4.2 国内研究现状简介  28-29
  1.5 课题主要工作简介  29-30
  1.6 本文结构  30-31
第二章 H.264视频编码简介  31-40
  2.1 H.264视频编码标准介绍  31-34
    2.1.1 H.264的分层结构  31-33
    2.1.2 H.264支持的图像帧结构  33
    2.1.3 H.264支持的图像帧类型  33-34
    2.1.4 档次与级别  34
  2.2 H.264视频编码主要技术简介  34-39
    2.2.1 整数变换与量化  35-36
    2.2.2 帧内预测编码  36
    2.2.3 帧间预测编码  36-37
    2.2.4 去块效应滤波器  37-38
    2.2.5 熵编码  38-39
  2.3 本章小结  39-40
第三章快速运动估计算法研究  40-78
  3.1 视频编码中的运动估计  40-46
    3.1.1 运动估计介绍  40-42
    3.1.2 几种主要的搜索策略  42-46
  3.2 H.264中基于零块判决的快速运动估计算法  46-55
    3.2.1 H.264中的整数变换及量化运算  47-49
    3.2.2 H.264中最佳零块判决阈值的确定  49-50
    3.2.3 H.264中结合零块判决的运动搜索算法  50-51
    3.2.4 实验结果  51-55
  3.3 基于菱形—三角形模板的快速整像素运动估计算法DTS  55-64
    3.3.1 搜索模板概述  55-56
    3.3.2 运动相关性及运动矢量的中心偏置特性  56-57
    3.3.3 基于菱形—三角形模板的快速运动估计算法DTS  57-62
    3.3.4 实验结果  62-64
  3.4 基于菱形—简化正方形模板的快速整像素运动估计算法DSSS  64-71
    3.4.1 DSSS算法所使用的模板  65-66
    3.4.2 DSSS算法的描述  66-68
    3.4.3 DSSS算法的分析  68-69
    3.4.4 实验结果  69-71
  3.5 快速分数像素运动估计算法研究  71-77
    3.5.1 H.264中的分数像素全搜索算法  72-73
    3.5.2 已有的快速分数像素搜索算法简介  73-74
    3.5.3 采用的自适应快速分数像素搜索算法  74-75
    3.5.4 实验结果  75-77
  3.6 本章小结  77-78
第四章快速模式选择算法研究  78-96
  4.1 H.264中的宏块分块模式及其模式选择算法  78-80
    4.1.1 H.264中的宏块分块模式  78
    4.1.2 H.264帧间片层编码模式选择算法  78-79
    4.1.3 H.264帧内片层(I_Slice)编码模式选择算法  79-80
  4.2 H.264中快速的帧内编码模式选择算法研究  80-89
    4.2.1 H.264中的帧内预测模式  80-81
    4.2.2 已有快速H.264帧内编码模式选择算法简介  81-83
    4.2.3 采用的快速帧内编码模式选择算法  83-87
    4.2.4 实验结果  87-89
  4.3 H.264中快速帧间编码模式选择算法研究  89-94
    4.3.1 已有快速帧间编码模式选择算法简介  89
    4.3.2 采用的快速帧间编码模式选择算法  89-93
    4.3.3 实验结果  93-94
  4.4 本章小结  94-96
第五章快速多参考帧选择算法研究  96-106
  5.1 H.264中的多参考帧选择算法  96-97
  5.2 已有快速多参考帧选择算法简介  97-99
  5.3 快速多参考帧选择算法  99-105
    5.3.1 不同序列使用参考帧数的统计结果与分析  99-101
    5.3.2 模式过滤及模式间多参考帧选择的相关性  101-102
    5.3.3 快速多参考帧选择算法的实现  102-103
    5.3.4 实验结果  103-105
  5.4 本章小结  105-106
第六章熵编码研究  106-117
  6.1 H.264视频编码标准熵编码介绍  106-112
    6.1.1 H.264中需要传送的语法元素  106-108
    6.1.2 H.264中编码方法介绍  108-112
  6.2 变长编码研究  112-116
    6.2.1 变长编码分析与研究  112-114
    6.2.2 新变长编码方案的实现和性能评测  114-116
  6.3 本章小结  116-117
第七章 H.264编码器在通用微处理器上的优化实现  117-132
  7.1 通用处理器中多媒体支持功能发展概况  117-123
    7.1.1 通用处理器中的媒体处理功能扩展简史  117-118
    7.1.2 通用处理器中多媒体扩展功能部件的执行方式  118-120
    7.1.3 Intel媒体处理指令集简介  120-123
  7.2 H.264编码器中关键模块的多媒体指令优化  123-127
    7.2.1 SAD计算的多媒体指令优化  123-124
    7.2.2 整数变换及其逆变换的多媒体指令优化  124-125
    7.2.3 SATD计算的多媒体指令优化  125-126
    7.2.4 亚像素插值的多媒体指令优化  126-127
    7.2.5 实验结果  127
  7.3 H.264编码器在PC上的优化实现  127-131
    7.3.1 H.264编码器算法优化前后的实验结果对比  128-129
    7.3.2 H.264编码器的总体优化实现  129-131
  7.4 本章总结  131-132
第八章结束语  132-134
  8.1 对课题研究的总结  132-133
  8.2 进一步研究和探讨  133-134
致谢  134-135
参考文献  135-144
作者在学期间取得的学术成果  144-146
附录A 作者在学期间主持或参加的科研项目  146

相似论文

基于率失真优化的码率控制算法研究,TN919.81
电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
电子稳像系统中旋转稳像算法研究,TP391.41
远程医疗系统图像压缩及传输关键技术研究,R318.0
面向无线视频传输的H.264错误隐藏技术研究,TN919.81
分布式视频编码边信息生成研究,TN919.81
基于P2P流媒体系统的设计与实现,TN919.8
基于H.264的解码器端错误遮蔽方法研究,TN919.81
H.264并行视频转码算法研究,TN919.81
基于多核计算平台的视频压缩算法研究,TN919.81
基于H.264/AVC可分级视频编码算法的研究,TN919.81
H.264/AVC帧内预测模式选择算法研究,TN919.81
基于FFmpeg的H.264解码器在Symbian上的移植和优化,TN919.81
基于CUDA架构的H.264并行计算研究,TN919.81
基于H.264/AVC的自适应运动估计算法研究,TN919.81
基于3G网络的智能交通视频监控系统的设计与实现,TP391.41
立体视觉里程计中的空间不确定度,TP391.41
多媒体传感终端设备关键技术的研究与实现,TP212.9
基于TMS320DM365的音视频传输及智能视频分析系统的设计与实现,TN919.8
基于H.264编解码器的智能手机流媒体客户端研究与实现,TN929.53
基于DM642的H.264视频编码实现及优化方法的研究,TN919.81