学位论文 > 优秀研究生学位论文题录展示

H.264并行编码算法设计及其在GPU上的实现

作 者: 赵洋
导 师: 郭成安
学 校: 大连理工大学
专 业: 电路与系统
关键词: H.264 图形处理器 计算统一设备架构 编码 并行算法
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 27次
引 用: 0次
阅 读: 论文下载
 

内容摘要


视频是含量最为丰富的信息载体。由于其庞大的信息量,视频压缩技术一直是人们研究的课题。作为新一代视频编码标准,H.264有着优异的压缩性能,但编码复杂度和编码耗时也随之增加。巨大的数据计算量成为影响编码速度的主要因素。近年来,GPU (Graphic Processing Unit,图形处理器)强大的浮点运算能力吸引着研究者用GPU做一些通用计算的工作,也就形成GPGPU (General Purpose GPU,通用计算图形处理器)的概念。NVIDIA公司于2007年推出计算统一设备架构,简称CUDA,CUDA的出现使得并行编程变得灵活。因此,GPU在视频图像压缩领域具有广阔的应用前景。本文采用CPU+GPU的异构编码器,双线程设计,使CPU和GPU协同工作。主线程由CPU负责,主要完成文件的读写、主机和设备端的数据交换及对GPU的调度。从线程由GPU负责,主要完成帧内编码、帧间编码及熵编码的计算工作。本文将整个视频编码过程都放在GPU中执行,这样既充分利用了GPU的运算资源,又将CPU从巨大的计算量中解放出来。针对H.264编码中耗时较多的模块,本文提出多种有效的并行算法。针对帧内编码,提出一种固定梯状并行算法;针对帧间编码,首先进行相关性分析,通过改变帧间编码顺序,预设MVP为零,提出宏块级并行的包含亚像素的全搜索运动估计并行算法和三步法运动估计并行算法;针对熵编码环节,提出一种熵编码并行方案。通过控制相关性、上下文相关性和存储相关性的分析,得到去相关方法,给出熵编码总体并行框架,通过信息统计、码流生成和码流合并三个环节实现熵编码的并行实现。本文提出的熵编码并行算法具有普遍性,并不局限于在GPU上实现,而是广泛适用于多核处理器、集群机系统等并行计算环境。该方案为并行难度实现很大的熵编码环节提供了一个有效的解决途径。实验结果表明,CPU+GPU的异构编码器能够充分利用GPU的运算资源,针对各个环节的并行算法在兼顾图像质量和压缩效率的同时,能够有效节省编码时间,编码速度得到较大提高。并行编码器与经多媒体指令集优化后的x264相比有4-6倍的加速,与未经多媒体指令集优化后的x264相比有35-71倍的加速。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-13
  1.1 课题研究背景  9-10
  1.2 国内外研究现状  10-11
  1.3 本文研究内容及结构安排  11-13
    1.3.1 本文的主要研究内容  11-12
    1.3.2 本文的章节安排  12-13
2 H.264编码标准与GPU编程概述  13-30
  2.1 H.264编码器框架  13-14
  2.2 H.264编码关键技术  14-20
  2.3 GPU与CUDA架构  20-24
    2.3.1 GPU与CUDA架构简介  20-21
    2.3.2 CUDA编程模型  21-23
    2.3.3 CUDA硬件模型  23-24
  2.4 CUDA程序的优化  24-30
3 基于GPU的H.264并行编码器设计  30-51
  3.1 总体架构设计  30-32
  3.2 帧内预测并行算法设计  32-36
    3.2.1 亮度帧内预测并行算法  32-34
    3.2.2 色度帧内预测并行算法  34-36
  3.3 帧间预测并行算法设计  36-43
    3.3.1 帧间预测相关性分析  36-37
    3.3.2 全搜索运动估计并行算法  37-42
    3.3.3 三步法运动估计并行算法  42-43
    3.3.4 两种并行搜索算法性能分析  43
  3.4 熵编码并行算法设计  43-49
    3.4.1 熵编码相关性分析  45-46
    3.4.2 熵编码总体并行框架  46-47
    3.4.3 信息统计与码流生成并行算法  47-48
    3.4.4 码流合并并行算法  48-49
  3.5 本章小结  49-51
4 实验结果分析  51-59
  4.1 帧内预测并行算法的实验  51-53
  4.2 帧间预测并行算法的实验  53-56
  4.3 熵编码并行算法的实验  56-57
  4.4 编码器总体性能分析  57-59
结论  59-61
参考文献  61-64
攻读硕士学位期间发表学术论文情况  64-65
致谢  65-66

相似论文

  1. 基于DSP的集成光栅细分数显装置的研制,TH822
  2. 转轴径向跳动和转速实时检测光电系统的研究,TH822
  3. 路面平整度检测系统中的数据采集和定位技术研究,U416.2
  4. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  5. 基于均值匹配的Turbo码联合译码的Matlab实现,TN911.22
  6. 基于率失真优化的码率控制算法研究,TN919.81
  7. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  8. 网络语音传输丢包的恢复技术,TN912.3
  9. 联合编码调制技术中TCM与BICM方案性能研究,TN911.22
  10. 高频雷达复合调制波形设计与处理,TN958.93
  11. DMR集群系统高层协议的设计和研究,TN929.52
  12. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  13. 基于纹理特征的视频编码技术研究,TP391.41
  14. 图像的稀疏表示及编码模型研究,TP391.41
  15. 基于地理位置的WSNs路由算法研究与改进,TN929.5
  16. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  17. 深水管道回接位姿检测系统研究,TE973.3
  18. 物联网在服装行业的应用性研究,TN929.5
  19. 江苏省稻瘟病菌遗传多样性及水稻抗瘟基因鉴定,S435.111.41
  20. 远程医疗系统图像压缩及传输关键技术研究,R318.0
  21. 中老年人健身认知观念的研究,G812.4

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com