学位论文 > 优秀研究生学位论文题录展示

基于同构多核处理器的H.264并行解码算法研究

作 者: 管辉
导 师: 杨孝宗
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: H.264 并行解码 TILE64 同构多核处理器
分类号: TN919.81
类 型: 硕士论文
年 份: 2009年
下 载: 77次
引 用: 0次
阅 读: 论文下载
 

内容摘要


视频压缩是多媒体通信领域关键支撑技术之一,对多媒体技术的应用与发展起到至关重要的作用。由于广泛应用于高清领域,H.264/AVC在高分辨率下的实时解码实现对处理器计算能力提出了很大的挑战。不过随着处理器多核架构的发展,在多核环境下并行解码就成为了一种有效的方式。但是由于H.264较高的算法复杂度,以及多核环境下复杂的核间通信与任务调度,使得并行化解码算法极具挑战性,在学术研究和实际应用中都成为研究的焦点。目前已有的H.264并行解码算法中,大部分只是关注于并行加速比,而对算法的实时性、负载均衡以及可扩展性等问题却没有进行综合性研究。本文的研究重点就是如何综合考虑各方面因素,完成并行解码方案的设计。本文根据H.264视频压缩标准的特点,分析了解码算法的并行性,提出了基于功能并行与数据并行的混合型并行策略;使用自适应宏块组机制解决了高分辨率下频繁调度引起性能损耗的问题;设计了基于条件矩阵和调度队列的动态任务调度机制,有效地控制了负载均衡,并且完成了算法理论加速比的分析与公式推导,针对一级流水线造成的性能瓶颈进行了串行扩展的分析。本文在TILE64同构多核处理器平台上完成了对并行解码算法的移植实现,并对其关键函数进行了代码级优化。实验的结果表明,本文提出的多核并行解码方案高效可行,能取得比较理想的加速比,且负载均衡控制良好,同时具有非常好的实时性和可扩展性。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-15
  1.1 课题背景  9-11
    1.1.1 多核处理器的发展趋势  9-10
    1.1.2 多媒体技术及其处理需求  10-11
  1.2 课题研究的目的和意义  11
  1.3 课题研究现状及分析  11-13
  1.3 本文主要研究工作  13
  1.4 本文的结构  13-15
第2章 并行理论基础  15-25
  2.1 微处理器发展现状  15-16
  2.2 多核处理器  16-18
  2.3 加速比系数  18-20
    2.3.1 Amdahl 定律  18-19
    2.3.2 Gustafson 定律  19
    2.3.3 Amdahl 定律和Gustafson 定律的等价性  19-20
    2.3.4 Karp-Flatt 度量  20
  2.4 TILE64 简介  20-23
    2.4.1 体系结构  21-22
    2.4.2 核间通信方式  22-23
    2.4.3 并行指令集  23
  2.4 本章小结  23-25
第3章 H.264 并行解码方案  25-43
  3.1 H.264 简介  25-29
    3.1.1 H.264 的特点及应用  25-27
    3.1.2 解码器原理  27-28
    3.1.3 功能负载分析  28-29
  3.2 并行策略  29-32
    3.2.1 功能并行  29
    3.2.2 数据并行  29-30
    3.2.3 功能并行与数据并行的对比  30
    3.2.4 混合模型  30-32
  3.3 数据并行  32-35
    3.3.1 数据并行层次  32-33
    3.3.2 数据依赖关系  33
    3.3.3 数据并行策略  33-34
    3.3.4 数据并行的理论加速比  34-35
  3.4 调度机制  35-37
    3.4.1 条件矩阵  36
    3.4.2 调度队列  36-37
    3.4.3 调度策略  37
  3.5 方案扩展  37-43
    3.5.1 自适应宏块组  37-38
    3.5.2 环路滤波的时机  38-40
    3.5.3 串行扩展  40-43
第4章 移植实现与优化  43-55
  4.1 移植方案  43-49
    4.1.1 处理核心映射  44-45
    4.1.2 代码调整  45-48
    4.1.3 调度机制的实现  48
    4.1.4 代码整合  48-49
  4.2 代码优化  49-54
    4.2.1 性能剖析  50-52
    4.2.2 代码级优化  52-53
    4.2.3 优化效果  53-54
  4.3 本章小结  54-55
第5章 实验数据及分析  55-66
  5.1 测试环境及平台  55-56
  5.2 测试用视频序列  56
  5.3 实验结果及分析  56-64
    5.3.1 不同分辨率下的加速比  56-61
    5.3.2 串行分量对整体加速比的影响  61-63
    5.3.3 负载均衡  63-64
  5.4 本章小结  64-66
结论  66-67
参考文献  67-71
攻读硕士学位期间发表的论文及其它成果  71-73
致谢  73

相似论文

  1. 基于率失真优化的码率控制算法研究,TN919.81
  2. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  3. 远程医疗系统图像压缩及传输关键技术研究,R318.0
  4. 面向无线视频传输的H.264错误隐藏技术研究,TN919.81
  5. 基于P2P流媒体系统的设计与实现,TN919.8
  6. 基于H.264的解码器端错误遮蔽方法研究,TN919.81
  7. H.264并行视频转码算法研究,TN919.81
  8. 基于多核计算平台的视频压缩算法研究,TN919.81
  9. H.264/AVC帧内预测模式选择算法研究,TN919.81
  10. 基于FFmpeg的H.264解码器在Symbian上的移植和优化,TN919.81
  11. 基于H.264/AVC的自适应运动估计算法研究,TN919.81
  12. 基于3G网络的智能交通视频监控系统的设计与实现,TP391.41
  13. 多媒体传感终端设备关键技术的研究与实现,TP212.9
  14. 基于TMS320DM365的音视频传输及智能视频分析系统的设计与实现,TN919.8
  15. 基于H.264编解码器的智能手机流媒体客户端研究与实现,TN929.53
  16. 基于DM642的H.264视频编码实现及优化方法的研究,TN919.81
  17. 基于ARM的无线实时公路道路视频传输的研究,TN919.8
  18. 网络视频监控系统设计与实现,TP277
  19. SVC分层视频传输的自适应LDPC-UEP方法研究,TN919.8
  20. 无线网络中可分级视频传输QoS保证跨层设计方法研究,TN919.81
  21. 面向ARM嵌入式系统的H.264解码研究,TP368.1

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 图像通信、多媒体通信 > 图像编码
© 2012 www.xueweilunwen.com