学位论文 > 优秀研究生学位论文题录展示
基于GPU的H.264到AVS视频转码并行设计
作 者: 高克顺
导 师: 郭成安
学 校: 大连理工大学
专 业: 电路与系统
关键词: H.264 数字音视频标准 图形处理器 计算统一设备架构 转码 并行算法
分类号: TN919.81
类 型: 硕士论文
年 份: 2011年
下 载: 36次
引 用: 0次
阅 读: 论文下载
内容摘要
H.264标准是当今压缩性能最优的标准,但是高昂的专利费用一直阻碍其在中国使用,于是我国自主研发了拥有与H.264性能相媲美性能的AVS (Audio Video coding Standard,数字音视频)标准。两种标准将在很长一段时间内长期共存,但由于两种标准计算复杂度比较高,使得二者之间的转码成为一个重要的研究课题。近年来GPU (Graphic Processing Unit,图形处理单元)的通用计算能力得到快速发展,特别是2007年英伟达(NVIDIA)公司推出了支持C语言与OpenCL语言的CUDA(Compute Unified Device Architecture,计算统一设备架构)软件平台,从而使GPU的程序开发变得简单灵活,也使得GPU在视频转码领域中有更为广阔的应用前景。本文的并行转码器采用CPU+GPU的双线程设计,CPU和GPU并发协同工作。CPU作为主线程负责转码中的熵解码、数据交互以及资源调度工作,GPU作为从线程负责转码中除熵解码外其它模块的工作,这样设计可以降低CPU与GPU间数据传递的次数。在转码过程中,为了充分发挥GPU并行计算的优势,为转码中计算密集、耗时长的模块设计并行算法。针对帧内预测环节邻块的相关性,设计了梯状并行算法。针对帧间运动估计环节,设计了一种基于全搜索的运动估计并行算法,该算法取消了利用邻块的运动矢量预测搜索起始点的环节,而是将搜索起始点设置为0提高并行粒度。针对熵编码中数据依赖、控制相关、码流存储优先等难题,提出了一种并行熵编码算法,该算法割裂了宏块间熵编码、码流优先存储的相关性,解决了限制熵编码并行实现的难题。针对两种视频标准关键环节的相似性,在转码过程中重用解码得到的信息,分别提出了基于信息重用的帧内预测、运动估计的并行算法,通过降低计算复杂度提高转码的速度。最后通过实验测试转码中各个模块的加速比以及图像性能指标,并对并行转码器的整体性能进行测评。实验结果表明:本文设计的并行转码器充分发挥了CPU与GPU硬件的特点,对计算密集的模块设计了适合GPU运行的并行算法,在保证图像质量的情况下,大大提高了转码速度。
|
全文目录
摘要 4-5 Abstract 5-9 1 绪论 9-13 1.1 课题研究背景 9-10 1.2 视频转码国内外研究现状概述 10-12 1.2.1 视频转码的研究现状与热点 10-11 1.2.2 GPU在视频转码领域的应用 11-12 1.3 本文研究内容与章节安排 12-13 2 H.264与AVS标准以及GPU编程基础知识概述 13-28 2.1 视频压缩标准发展史 13-14 2.2 H.264与AVS视频编码标准 14-22 2.2.1 H.264解码与AVS编码原理 14-16 2.2.2 H.264与AVS标准关键技术及其异同点 16-22 2.3 GPU编程与CUDA架构概述 22-26 2.3.1 GPU的发展简介 22-23 2.3.2 GPU的硬件结构以及与CPU的比较 23-24 2.3.3 CUDA的编程知识概述 24-26 2.4 GPU应用于视频压缩领域的优势与挑战 26-27 2.5 本章小结 27-28 3 基于GPU的H.264到AVS视频转码并行算法设计 28-56 3.1 H.264到AVS转码器结构框架设计 28-30 3.1.1 传统的H.264到AVS转码器的框架结构 28-29 3.1.2 CPU+GPU异构H.264到AVS并行视频转码架构设计 29-30 3.2 帧内预测并行算法 30-35 3.2.1 亮度、色度帧内预测并行算法 30-32 3.2.2 转码帧内预测模式重用并行算法 32-34 3.2.3 两种帧内预测算法性能比较 34-35 3.3 运动估计并行算法 35-43 3.3.1 像素内插与运动估计并行算法 35-38 3.3.2 并行运动矢量搜索合并算法 38-41 3.3.3 转码矢量重用并行算法 41-42 3.3.4 CUDA分析软件Profile分析算法性能 42-43 3.4 AVS熵编码并行算法设计 43-54 3.4.1 AVS熵编码框架 43-45 3.4.2 并行熵编码相关性分析 45-46 3.4.3 指数哥伦布编码并行算法 46-50 3.4.4 两级码流合并并行算法 50-54 3.5 转码过程中CPU与GPU并行处理设计与分析 54-55 3.6 本章小结 55-56 4 实验结果举例与分析 56-65 4.1 帧内预测并行算法的实验 56-58 4.2 帧间运动估计算法的实验 58-60 4.3 熵编码并行算法实验 60-62 4.4 整体性能分析 62-64 4.5 本章小结 64-65 5 总结与展望 65-67 参考文献 67-70 攻读硕士学位期间发表学术论文情况 70-71 致谢 71-72
|
相似论文
- 基于率失真优化的码率控制算法研究,TN919.81
- 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
- 频繁图结构并行挖掘算法的研究与实现,TP311.13
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 远程医疗系统图像压缩及传输关键技术研究,R318.0
- 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
- 面向无线视频传输的H.264错误隐藏技术研究,TN919.81
- 基于P2P流媒体系统的设计与实现,TN919.8
- 基于H.264的解码器端错误遮蔽方法研究,TN919.81
- H.264并行视频转码算法研究,TN919.81
- 基于多核计算平台的视频压缩算法研究,TN919.81
- H.264/AVC帧内预测模式选择算法研究,TN919.81
- 基于FFmpeg的H.264解码器在Symbian上的移植和优化,TN919.81
- 基于CUDA架构的H.264并行计算研究,TN919.81
- 基于H.264/AVC的自适应运动估计算法研究,TN919.81
- 基于3G网络的智能交通视频监控系统的设计与实现,TP391.41
- 无线网络中视频传输容错及转码技术研究,TN919.81
- 多媒体传感终端设备关键技术的研究与实现,TP212.9
- 基于TMS320DM365的音视频传输及智能视频分析系统的设计与实现,TN919.8
- 基于H.264编解码器的智能手机流媒体客户端研究与实现,TN929.53
- 基于DM642的H.264视频编码实现及优化方法的研究,TN919.81
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com
|