学位论文 > 优秀研究生学位论文题录展示

螺旋锥束CT三维重建中的Hilbert变换的脉动阵列设计

作 者: 黄棋波
导 师: 张岩
学 校: 哈尔滨工业大学
专 业: 微电子学与固体电子学
关键词: 锥束CT Katsevich算法 Hilbert变换 脉动阵列 CUDA
分类号: TP391.41
类 型: 硕士论文
年 份: 2008年
下 载: 45次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着多层螺旋CT(Computed Tomography)的出现,医用CT正在向着螺旋锥束CT转变。用螺旋锥束扫描方式重建得到的图像具有扫描速度快、空间分辨率高等优点,但由于这种成像方式在理论上比较复杂,技术实现也有相当大的难度,尤其在实现的速度方面一直是个难以突破的瓶颈,其中希尔伯特滤波和反投影成像是制约实时性的两个关键步骤。本文是对其中希尔伯特滤波部分做的探索性研究。本文研究内容主要包含以下三个部分:首先,深入研究了螺旋锥束CT Katsevich算法成像过程中的关键步骤,并对希尔伯特滤波及其三种实现方法作了深入剖析和对比,阐述了选取脉动阵列实现离散希尔伯特变换的理由。其次,在全面理解CUDA(Compute Unified Device Architecture)平台的基础上,设计了基于NVIDIA GeForce 9800GX2显卡的脉动阵列式离散希尔伯特变换的软件实现,针对CUDA平台做了代码的优化,并使用Kahan求和算法大幅提高了实现精度,在速度上与CPU中实现相比提高了83倍。最后在基于XILINX公司Virtex-5系列XC5VLX50T器件的ISE10.1环境中设计了其硬件实现。硬件结构主要包括总体时序控制单元、存储单元及其时序发生器、串并转换单元、移位器、选通器、运算单元和级联加法器。在流水线作业的情况下,数据的吞吐率为30M/s。本文给出了实现过程的详细步骤,与GPU方案的对比结果,扩展PE复用和定点化的优化思路。最终仿真和综合结果为Slice使用率78%,最高工作频率为239.751MHz。本文设计的基于脉动阵列式的离散希尔伯特变换,软硬件两种方案的实现均有较大的实际意义,为今后螺旋锥束CT三维图像重建的整体实时实现提供了良好条件,并且在精确度、实时性和成本上都有一定的竞争优势和良好的应用前景。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-14
  1.1 课题背景  9
  1.2 国内外相关技术发展历史和现状  9-11
  1.3 本课题研究目的及意义  11-12
  1.4 本文主要研究内容  12-14
第2章 Katsevich重建算法及其DHT实现  14-27
  2.1 引言  14-15
  2.2 CT原理介绍  15
  2.3 螺旋锥束CT Katsevich类FBP算法  15-19
    2.3.1 锥形束重构公式的困难  16
    2.3.2 Katsevich螺旋CT非移变FBP算法  16-19
    2.3.3 希尔伯特滤波  19
  2.4 DHT的实现方式  19-26
    2.4.1 希尔伯特变换的基本原理  20-21
    2.4.2 傅立叶变换实现DHT  21
    2.4.3 Hartley变换实现DHT  21-22
    2.4.4 脉动阵列实现DHT  22-25
    2.4.5 三种实现方式比较  25-26
  2.5 本章小结  26-27
第3章 基于CUDA平台的脉动阵列式DHT设计  27-46
  3.1 引言  27-28
  3.2 GPU与NVIDIA G80  28-30
    3.2.1 GPU简介  28-29
    3.2.2 GPU计算技术  29-30
    3.2.3 NVIDIA G80 系列  30
  3.3 CUDA通用计算平台  30-39
    3.3.1 CUDA简介  30-32
    3.3.2 编程模型  32-34
    3.3.3 硬件实现  34-37
    3.3.4 应用程序编程接口  37-39
  3.4 运用CUDA实现脉动阵列式DHT  39-45
    3.4.1 模型搭建  39-40
    3.4.2 程序设计  40-44
    3.4.3 CUDA平台实现与结果分析  44-45
  3.5 本章小结  45-46
第4章 基于FPGA的脉动阵列式DHT设计  46-61
  4.1 引言  46-47
  4.2 FPGA硬件平台  47-50
    4.2.1 Virtex-5 系列FPGA特点  47-48
    4.2.2 IP复用技术  48-49
    4.2.3 DSP48E  49-50
  4.3 FPGA硬件平台的DHT设计  50-60
    4.3.1 32 位浮点数标准  50-51
    4.3.2 硬件设计要点概述  51-52
    4.3.3 PE单元  52-53
    4.3.4 整体框架  53-56
    4.3.5 仿真综合结果  56-59
    4.3.6 CUDA与FPGA平台设计结果对比与分析  59-60
  4.4 本章小结  60-61
结论  61-62
参考文献  62-66
附录1 离散Hartley变换实现DHT的公式推导  66-68
附录2 脉动阵列实现DHT计算公式实例  68-69
附录3 CUDA平台实现DHT的主要程序  69-73
致谢  73-74
个人简历  74-75

相似论文

  1. 基于一阶矩的DFT的FPGA实现,TN911.72
  2. 基于GPU的有限元方法研究,O241.82
  3. 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
  4. 基于GPGPU的快速白光干涉测量系统研究,O439
  5. 群体仿真算法研究及疏散仿真系统开发,TP391.9
  6. 基于GPU的图书推荐系统研究与实现,TP391.3
  7. 基于CUDA的视频火灾检测系统,TP391.41
  8. 基于GPU的X射线重建算法加速研究,TP391.41
  9. 基于GPU加速的中性气体泄漏模拟与救援研究,TP391.41
  10. 基于CUDA的实时图像拼接技术研究,TP391.41
  11. 基于CPU+GPU异构平台的字符串匹配算法研究与实现,TP301.6
  12. 基于FPGA的锥束CT重建加速关键技术研究,TP391.41
  13. GPU通用计算与基于SIFT特征的图像匹配并行算法研究,TP391.41
  14. 基于粒子模拟问题的GPU高性能计算系统,TP338
  15. 基于GPU加速的光子映射技术研究,TP391.41
  16. 螺旋锥束CT三维重建中高速流水线DHT的硬件设计与实现,TP391.41
  17. GPS掩星资料处理的GPU并行算法研究,TP391.41
  18. Krylov子空间方法的GPU加速算法研究,TP391.41
  19. 基于CUDA的H.264并行编码器研究与实现,TN919.81
  20. 基于CBCT图像的PCB网表提取技术研究,TN41
  21. 基于GPU和压缩索引的新一代测序数据再测序研究,Q78

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com