学位论文 > 优秀研究生学位论文题录展示

全方位视觉的多核并行处理研究与应用

作 者: 徐茂兴
导 师: 张健
学 校: 浙江工业大学
专 业: 计算机软件与理论
关键词: 全方位视觉 多核技术 并行处理 DAG 串行算法
分类号: TP332
类 型: 硕士论文
年 份: 2010年
下 载: 37次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着多核处理器的迅速普及,多核并行计算已经成为计算机领域的一个重要研究课题。尽管多核处理器的计算能力显著提升,但是由于当前大量软件都是基于单核处理器开发,不能有效利用多核处理器的优势。为了充分利用多核资源,发挥多核处理器的性能,本文提出了多核处理器上串行程序并行化的解决方案,并将串行程序并行化设计方案应用到全方位视觉运动目标检测和跟踪中。首先对多核并行编程、单核处理器编程和多机分布式编程进行了分析和比较。基于处理器上多个核的编程环境,给出了串行程序并行化的设计流程。根据多核处理器的核间通信比多个计算机间通信开销小的特点,把DAG模型引入到多核并行计算中,并进行了改进。研究和分析了任务之间的依赖关系,包括数据依赖关系和控制依赖关系,分别给出了与依赖关系相对应的DAG图构建方法。在表调度算法的基础上,得到基于DAG图的任务调度算法。剖析视频中运动目标检测和跟踪任务,将任务分解成若干个具有相互依赖关系的子任务。采用本文中提出的基于DAG模型的并行算法,构建出与运动目标检测和跟踪任务相对应的DAG图。并利用改进后的表调度算法,实现对运动目标检测和跟踪DAG图的任务调度。最后,本文将改进后的全方位视觉运动目标检测和跟踪算法,在双核处理器上实现,并进行了运行速度的测试。算法的主体部分,即检测和跟踪的任务实现了1.55倍的加速;并行化最好的部分能使加速比达到1.71。通过Intel Thread Profiler线程档案器检测得到的线程负载也基本上达到平衡。

全文目录


摘要  5-6
ABSTRACT  6-10
第1章 绪论  10-15
  1.1 研究的背景和意义  10-11
  1.2 国内外多核处理器发展和研究现状  11-13
  1.3 本文研究的内容和论文结构  13-14
  1.4 本章小结  14-15
第2章 多核并行编程概述  15-27
  2.1 多核并行编程环境  15-16
    2.1.1 多核处理器与单核处理器  15-16
    2.1.2 多核并行编程与多机分布式编程  16
  2.2 多核并行编程策略和并行编程模式  16-19
  2.3 多核并行编程方法  19-26
    2.3.1 串行程序并行化设计流程  19-20
    2.3.2 Windows 多线程编程  20-22
    2.3.3 OpenMP 多线程编程  22-26
  2.4 本章小结  26-27
第3章 基于 DAG 模型的并行算法  27-40
  3.1 DAG 模型  27-31
    3.1.1 DAG 模型的定义  27-29
    3.1.2 基准任务定律  29-30
    3.1.3 跨度定律  30-31
    3.1.4 并行性  31
  3.2 任务间的依赖关系  31-36
    3.2.1 依赖关系的定义  31-34
    3.2.2 构建数据依赖关系的DAG 图  34-35
    3.2.3 构建循环迭代的DAG 图  35-36
  3.3 DAG 任务调度算法  36-39
    3.3.1 任务调度的NP 完全性  36-37
    3.3.2 任务调度算法描述  37-39
  3.4 本章小结  39-40
第4章 多核并行处理全方位视觉中的应用  40-58
  4.1 全方位视觉系统  40-43
    4.1.1 全方位视觉运动目标检测与跟踪  40-42
    4.1.2 运动目标检测和跟踪任务划分  42-43
  4.2 目标检测和跟踪的并行化设计  43-52
    4.2.1 基准任务  43-46
    4.2.2 任务之间的依赖关系的描述  46-48
    4.2.3 构建DAG 图及任务调度  48-52
  4.3 实验结果及分析  52-57
    4.3.1 实验环境  52-53
    4.3.2 实验结果  53-56
    4.3.3 并行程序任务负载平衡情况  56-57
  4.4 本章小结  57-58
第5章 结束语  58-60
  5.1 本文完成的工作及特点  58
  5.2 问题与进一步研究建议  58-60
参考文献  60-63
致谢  63-64
攻读学位期间参加的科研项目和成果  64

相似论文

  1. 基于DAG的MAC协议研究,TP212.9
  2. 多DSP并行航迹规划系统接口驱动程序设计与实现,TP368.12
  3. 实时海洋浮游生物目标智能识别系统设计,TP391.41
  4. 基于单相机全方位立体视觉系统的视觉里程计研究,TP391.41
  5. 自动化生产车间资源配置仿真及优化,O226
  6. 基于非负矩阵分解的高光谱遥感图像混合像元分解研究,TP751.1
  7. DTMB中3780点FFT在多核DSP平台上的实现,TP368.1
  8. 虚拟地形环境中地形数据金字塔模型的建模和处理技术的研究,P209
  9. 面向DAG数据依赖型应用系统研究与实现,TP311.1
  10. 海量空间数据的分布式存储管理及并行处理技术研究,TP333
  11. 基于PC集群矿山海量空间数据并行处理与可视化,P628.3
  12. 基于多核的网络设备测试系统软件设计,TP393.05
  13. 基于银行核心帐务系统构建借贷记合一的银行卡,F832.2
  14. 基于FPGA的实时图像处理系统的设计与实现,TP391.41
  15. 短波信号源与多路并行接收平台设计与实现,TN911.7
  16. 基于多处理器的数字电路系统设计和实现,TN79
  17. 基于GPU的二维矢量场可视化点噪声方法的研究与实现,TP391.41
  18. OpenMP并行编程模型与性能优化方法的研究及应用,TP311.11
  19. 基于Cavium平台的网络流分类系统的设计与实现,TP393.06
  20. 基于并行协议分析的网络内容监控技术研究,TP393.08

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com