学位论文 > 优秀研究生学位论文题录展示

基于GPU的H.264到AVS视频转码并行设计

作 者: 高克顺
导 师: 郭成安
学 校: 大连理工大学
专 业: 电路与系统
关键词: H.264 数字音视频标准 图形处理器 计算统一设备架构 转码 并行算法
分类号: TN919.81
类 型: 硕士论文
年 份: 2011年
下 载: 36次
引 用: 0次
阅 读: 论文下载
 

内容摘要


H.264标准是当今压缩性能最优的标准,但是高昂的专利费用一直阻碍其在中国使用,于是我国自主研发了拥有与H.264性能相媲美性能的AVS (Audio Video coding Standard,数字音视频)标准。两种标准将在很长一段时间内长期共存,但由于两种标准计算复杂度比较高,使得二者之间的转码成为一个重要的研究课题。近年来GPU (Graphic Processing Unit,图形处理单元)的通用计算能力得到快速发展,特别是2007年英伟达(NVIDIA)公司推出了支持C语言与OpenCL语言的CUDA(Compute Unified Device Architecture,计算统一设备架构)软件平台,从而使GPU的程序开发变得简单灵活,也使得GPU在视频转码领域中有更为广阔的应用前景。本文的并行转码器采用CPU+GPU的双线程设计,CPU和GPU并发协同工作。CPU作为主线程负责转码中的熵解码、数据交互以及资源调度工作,GPU作为从线程负责转码中除熵解码外其它模块的工作,这样设计可以降低CPU与GPU间数据传递的次数。在转码过程中,为了充分发挥GPU并行计算的优势,为转码中计算密集、耗时长的模块设计并行算法。针对帧内预测环节邻块的相关性,设计了梯状并行算法。针对帧间运动估计环节,设计了一种基于全搜索的运动估计并行算法,该算法取消了利用邻块的运动矢量预测搜索起始点的环节,而是将搜索起始点设置为0提高并行粒度。针对熵编码中数据依赖、控制相关、码流存储优先等难题,提出了一种并行熵编码算法,该算法割裂了宏块间熵编码、码流优先存储的相关性,解决了限制熵编码并行实现的难题。针对两种视频标准关键环节的相似性,在转码过程中重用解码得到的信息,分别提出了基于信息重用的帧内预测、运动估计的并行算法,通过降低计算复杂度提高转码的速度。最后通过实验测试转码中各个模块的加速比以及图像性能指标,并对并行转码器的整体性能进行测评。实验结果表明:本文设计的并行转码器充分发挥了CPU与GPU硬件的特点,对计算密集的模块设计了适合GPU运行的并行算法,在保证图像质量的情况下,大大提高了转码速度。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-13
  1.1 课题研究背景  9-10
  1.2 视频转码国内外研究现状概述  10-12
    1.2.1 视频转码的研究现状与热点  10-11
    1.2.2 GPU在视频转码领域的应用  11-12
  1.3 本文研究内容与章节安排  12-13
2 H.264与AVS标准以及GPU编程基础知识概述  13-28
  2.1 视频压缩标准发展史  13-14
  2.2 H.264与AVS视频编码标准  14-22
    2.2.1 H.264解码与AVS编码原理  14-16
    2.2.2 H.264与AVS标准关键技术及其异同点  16-22
  2.3 GPU编程与CUDA架构概述  22-26
    2.3.1 GPU的发展简介  22-23
    2.3.2 GPU的硬件结构以及与CPU的比较  23-24
    2.3.3 CUDA的编程知识概述  24-26
  2.4 GPU应用于视频压缩领域的优势与挑战  26-27
  2.5 本章小结  27-28
3 基于GPU的H.264到AVS视频转码并行算法设计  28-56
  3.1 H.264到AVS转码器结构框架设计  28-30
    3.1.1 传统的H.264到AVS转码器的框架结构  28-29
    3.1.2 CPU+GPU异构H.264到AVS并行视频转码架构设计  29-30
  3.2 帧内预测并行算法  30-35
    3.2.1 亮度、色度帧内预测并行算法  30-32
    3.2.2 转码帧内预测模式重用并行算法  32-34
    3.2.3 两种帧内预测算法性能比较  34-35
  3.3 运动估计并行算法  35-43
    3.3.1 像素内插与运动估计并行算法  35-38
    3.3.2 并行运动矢量搜索合并算法  38-41
    3.3.3 转码矢量重用并行算法  41-42
    3.3.4 CUDA分析软件Profile分析算法性能  42-43
  3.4 AVS熵编码并行算法设计  43-54
    3.4.1 AVS熵编码框架  43-45
    3.4.2 并行熵编码相关性分析  45-46
    3.4.3 指数哥伦布编码并行算法  46-50
    3.4.4 两级码流合并并行算法  50-54
  3.5 转码过程中CPU与GPU并行处理设计与分析  54-55
  3.6 本章小结  55-56
4 实验结果举例与分析  56-65
  4.1 帧内预测并行算法的实验  56-58
  4.2 帧间运动估计算法的实验  58-60
  4.3 熵编码并行算法实验  60-62
  4.4 整体性能分析  62-64
  4.5 本章小结  64-65
5 总结与展望  65-67
参考文献  67-70
攻读硕士学位期间发表学术论文情况  70-71
致谢  71-72

相似论文

  1. 基于率失真优化的码率控制算法研究,TN919.81
  2. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  3. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  4. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  5. 远程医疗系统图像压缩及传输关键技术研究,R318.0
  6. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  7. 面向无线视频传输的H.264错误隐藏技术研究,TN919.81
  8. 基于P2P流媒体系统的设计与实现,TN919.8
  9. 基于H.264的解码器端错误遮蔽方法研究,TN919.81
  10. H.264并行视频转码算法研究,TN919.81
  11. 基于多核计算平台的视频压缩算法研究,TN919.81
  12. H.264/AVC帧内预测模式选择算法研究,TN919.81
  13. 基于FFmpeg的H.264解码器在Symbian上的移植和优化,TN919.81
  14. 基于CUDA架构的H.264并行计算研究,TN919.81
  15. 基于H.264/AVC的自适应运动估计算法研究,TN919.81
  16. 基于3G网络的智能交通视频监控系统的设计与实现,TP391.41
  17. 无线网络中视频传输容错及转码技术研究,TN919.81
  18. 多媒体传感终端设备关键技术的研究与实现,TP212.9
  19. 基于TMS320DM365的音视频传输及智能视频分析系统的设计与实现,TN919.8
  20. 基于H.264编解码器的智能手机流媒体客户端研究与实现,TN929.53
  21. 基于DM642的H.264视频编码实现及优化方法的研究,TN919.81

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com