学位论文 > 优秀研究生学位论文题录展示
AVS视频编码并行算法的研究与实现
作 者: 胡文安
导 师: 于鸿洋
学 校: 电子科技大学
专 业: 信号与信息处理
关键词: AVS OpenMP 并行编码 加速比
分类号: TN919.81
类 型: 硕士论文
年 份: 2010年
下 载: 58次
引 用: 1次
阅 读: 论文下载
内容摘要
由中国数字音视频编码技术标准工作组制定的新一代视频编码国家标准AVS(Audio and Video coding Standard),因其具有很高的编解码性能,比H.264要低的复杂度,以及专利授权费用低等优点,越来越得到广泛的应用和学术研究。但是由于AVS采用了最新的视频编码技术,使得编码速度较上一代视频编码标准要低很多。目前,随着多核处理器的普及,利用多核处理器进行多线程并行编码将会有效的提高编码速度。而OpenMP作为一个面向共享存储多处理器系统的多线程编程标准,为程序员编写多线程应用程序提供了一个简单而高效应用程序编程接口。为提高AVS视频编码速度,本文在深入了解并行计算理论、AVS编码标准和OpenMP多线程编程标准的基础上,主要完成了3方面的工作:首先使用OpenMP在AVS编码器官方参考模型RM62f上完成了GOP级、Slice级和帧级并行编码算法。这几种算法都在Intel四核处理器平台上进行了测试并给出了线程数与加速比、PSNR和码率的关系。实验结果表明,并行算法对AVS编码速度的提高非常明显,不过它们还是有各自的缺点。其次针对帧级并行算法扩展性不够和负载不均衡的缺点,提出了一种基于任务队列模型的帧级并行编码算法。实验结果证明,此算法在四核平台上的加速比最高能达到3.9x,在信噪比和码率保持不变的基础上,提高了编码速度和CPU利用率,有效改善帧级并行算法的不足。最后,为了进一步提高编码速度,本文利用了Intel多媒体指令集SSE2和SSE4中的视频编码加速指令,分别实现了AVS视频编码的SIMD并行优化,并结合基于任务队列模型的帧级并行算法在Intel四核处理器平台上进行了测试。实验表明,Intel多媒体指令集对AVS视频编码速度的提升是非常显著的,尤其是最新的SSE4,与基于任务队列的帧级并行算法结合,加速比最高能达到14.8x。
|
全文目录
摘要 4-5 ABSTRACT 5-10 第一章 绪论 10-21 1.1 视频编码标准发展概况 10-11 1.2 微处理器的发展 11-12 1.3 并行理论简介 12-19 1.3.1 并行计算机体系结构与分类方法 12-14 1.3.2 并行计算 14-16 1.3.3 并行算法性能衡量标准 16-19 1.3.3.1 Amdahl 定律 17 1.3.3.2 Gustafson 定律 17-18 1.3.3.3 Amdahl 定律与Gustafson 定律的关系 18-19 1.4 选题的意义 19 1.5 本论文的主要内容 19-21 1.5.1 研究内容 19-20 1.5.2 结构安排 20-21 第二章 AVS 视频编码标准 21-28 2.1 AVS 编码器框架 21-22 2.2 AVS 视频编码的关键技术 22-27 2.2.1 帧内预测 23-24 2.2.2 帧间预测 24-25 2.2.3 变换与量化 25-26 2.2.4 熵编码 26-27 2.2.5 环路滤波 27 2.3 本章小结 27-28 第三章 AVS 视频编码的并行化研究 28-38 3.1 AVS 的并行编码模式 28-30 3.2 并行程序编程接口 30-37 3.2.1 Windows 多线程编程 30 3.2.2 Linux 多线程编程 30-31 3.2.3 MPI 31 3.2.4 OpenMP 31-37 3.2.4.1 Fork-Join 模式 32-33 3.2.4.2 OpenMP 多线程编程基础 33-36 3.2.4.3 OpenMP 多线程程序性能影响因素 36-37 3.3 本章小结 37-38 第四章 GOP、Slice 和帧级并行编码算法 38-63 4.1 GOP 级并行编码算法 38-47 4.1.1 基于OpenMP 的GOP 级并行算法实现 39 4.1.2 在Intel 四核处理器平台上的测试 39-44 4.1.3 线程数与加速比的关系 44-46 4.1.4 线程数与PSNR 的关系 46-47 4.2 Slice 级并行编码算法 47-56 4.2.1 基于OpenMP 的Slice 级并行算法实现 47-48 4.2.2 在Intel 四核处理器平台上的测试 48-51 4.2.3 线程数与加速比的关系 51-52 4.2.4 线程数与码率的关系 52-56 4.3 帧级并行编码算法 56-62 4.3.1 基于OpenMP 的帧级并行算法实现 57-58 4.3.2 在Intel 四核处理器平台上的测试 58-60 4.3.3 线程数与加速比的关系 60-62 4.4 本章小结 62-63 第五章 基于任务队列模型的帧级并行编码算法 63-72 5.1 基于任务队列模型的帧级并行编码算法简介 63-65 5.2 基于OpenMP 的并行算法实现 65-66 5.3 在Intel 四核处理器平台上的测试 66-69 5.4 帧级并行算法优化前后的加速比对比 69-71 5.5 本章小结 71-72 第六章 AVS 视频编码的SIMD 并行优化 72-83 6.1 Intel 多媒体指令集介绍 72-73 6.2 利用SSE2 对AVS 运动估计模块的优化 73-78 6.2.1 在Intel 四核处理器平台上的测试 75-77 6.2.2 SSE2 优化前后的加速比对比 77-78 6.3 SSE4 对AVS 运动估计模块的优化 78-82 6.3.1 在Intel 四核处理器平台上的测试 79-81 6.3.2 SSE4 优化前后的加速比对比 81-82 6.4 本章小结 82-83 第七章 总结与展望 83-84 致谢 84-85 参考文献 85-87 攻硕期间取得的研究成果 87-88
|
相似论文
- AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
- 大规模计算环境下网络模拟任务划分研究,TP393.01
- 高效三维视频表达及编码技术研究与开发,TN919.81
- 基于DM6467 DSP处理器的多通道H.264视频编码软件设计,TN919.81
- 基于OpenMP的遗传退火算法的并行化,TP301.6
- 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
- FDTD与MPSTD并行算法在电磁散射中的应用研究,O441.4
- 遥感图像分块分类技术的研究与应用,TP751
- 软件优化技术在软件开发项目中的应用研究,TP311.52
- AVS视频解码器中去块效应环路滤波模块的硬件设计,TN919.81
- AVS音频编码算法研究,TN911.21
- 数字音频码流分析系统研究,TN911.7
- 基于CUDA的H.264并行编码器研究与实现,TN919.81
- 基于MPI和OpenMP的三维FDTD并行算法的研究,TN011
- 电网调度中心在线数据整合的研究和实践,TM73
- AVS帧内预测解码算法的硬件化设计与验证,TN919.81
- 基于网络摄像机关键技术的研究,TN919.81
- AVS视频编码关键算法的研究,TN919.81
- AVS在ISMA框架中实时应用的QoS关键技术研究,TN919.85
- AVS在CMMB体系下复用算法与RTP协议的关键技术研究,TN943
- 基于H.264及AVS高清视频解码芯片的研究及ASIC实现,TN492
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com
|