学位论文 > 优秀研究生学位论文题录展示

多视图图像的快速三维场景重建

作 者: 田文
导 师: 王宏远
学 校: 华中科技大学
专 业: 信息与通信工程
关键词: 从运动恢复结构 多视图重建 特征提取与匹配 尺度不变特征变换 图形处理器 统一计算设备架构 局部敏感哈希 随机抽样一致性算法
分类号: TP391.41
类 型: 博士论文
年 份: 2010年
下 载: 394次
引 用: 0次
阅 读: 论文下载
 

内容摘要


多视图重建是计算机视觉领域的一个基本问题,有着广泛的应用前景。本文研究的问题是如何高效率的实现大规模的多视图重建,随着输入视图数量的增多,完成重建所需要的计算量和时间会快速增长。经过理论分析和实验证明,一个大规模的多视图重建系统的性能瓶颈主要在于如下的两个环节:(1)特征的提取与匹配;(2)多视图几何约束关系的计算。作为多视图重建的开始,首先需要对输入的每幅视图提取特征点,随后再在两两视图之间计算特征匹配;这一步骤所需的计算量会随着输入视图的增加呈平方等级的增长。另外多视图几何约束关系也是需要在两两视图之间计算,因此随着输入视图数的增多,这一步骤的计算量也会快速增长;如何在追求高效的同时兼顾算法的精度与鲁棒性,也是本文需要考虑的问题。特征提取方面,提出了一种适合图形处理器(GPU)加速计算的并行尺度不变特征变换(SIFT)算法;针对SIFT算法的各个步骤进行了详细的复杂度分析和并行化处理。实验证明,本文算法在640×480的图像分辨率下每秒完成28帧图像的特征提取,在不影响算法精度的前提下相比CPU算法加速比超过了30倍,相比现有的GPU算法加速比达到了1.5倍以上。特征匹配方面,提出了一种基于局部敏感哈希(LSH)的多视图特征匹配方法;不同于现有算法基于两两视图间局部匹配的策略,本文算法基于数据库索引的思想提出了一种全局匹配算法;并针对SIFT特征描述子的数据特性,使用超球面划分和随机K维查找树划分对LSH算法进行了改进。实验证明,本文算法在降低匹配精度9%到20%的情况下相对线性算法速度提升到了2.9至7.8倍。多视图几何约束关系计算方面,提出了一种新算法LO-MLESAC;通过在随机抽样一致的策略中加入局部优化和最大似然估计,实现了基础矩阵的快速高精度的计算。另外,在多视图两两关系计算中,通过对循环次数和运行时间的限制,快速去除了匹配度低的视图对。实验证明,本文算法在输出局内点点数减少不超过5%的基础上算法速度提升到了原有算法的2.4到3.1倍。

全文目录


摘要  4-6
Abstract  6-8
目录  8-10
1 绪论  10-24
  1.1 研究背景  11-14
  1.2 本文组织与创新点  14-24
2 多视图重建系统分析  24-50
  2.1 多视图几何学  24-37
  2.2 特征提取  37-44
  2.3 高维空间下的最近邻搜索  44-46
  2.4 随机抽样一致性算法  46-48
  2.5 本章小结  48-50
3 快速特征提取  50-80
  3.1 问题描述  50
  3.2 SIFT特征提取  50-55
  3.3 特征提取的快速算法  55-61
  3.4 SIFT算法复杂度及可并行性分析  61-63
  3.5 基于CUDA的SIFT快速并行算法  63-74
  3.6 实验结果  74-79
  3.7 本章小结  79-80
4 快速多视图特征匹配  80-98
  4.1 问题描述  80-81
  4.2 似最近邻搜索  81-85
  4.3 基于LSH的快速多视图特征匹配  85-92
  4.4 实验结果  92-96
  4.5 本章小结  96-98
5 快速双视图几何关系计算  98-110
  5.1 问题描述  98
  5.2 最大似然抽样一致算法  98-100
  5.3 局部优化快速MLESAC算法  100-103
  5.4 快速局外点过滤  103-105
  5.5 实验结果  105-109
  5.6 本章小结  109-110
6 系统实验  110-120
  6.1 实验数据  110-111
  6.2 实验配置  111-114
  6.3 实验结果  114-118
  6.4 本章小结  118-120
7 总结与展望  120-122
  7.1 本文的研究成果与创新点  120-121
  7.2 研究展望  121-122
致谢  122-124
参考文献  124-132
附录1 攻读学位期间发表的学术论文  132

相似论文

  1. 基于多核计算平台的视频压缩算法研究,TN919.81
  2. 基于CUDA架构的H.264并行计算研究,TN919.81
  3. 裸眼三维增强现实关键技术研究,TP391.41
  4. Web图像搜索中基于GPU的图像分割技术术究,TP391.41
  5. 基于SIFT的数字水印算法研究,TP309.7
  6. 流体场景的屏幕空间实时绘制研究,TP391.41
  7. 基于多幅图像的几何和纹理自动重建,TP391.41
  8. 立体视觉三维重建相关技术研究与实现,TP391.41
  9. 基于GPU的H.264到AVS视频转码并行设计,TN919.81
  10. 虹膜识别关键技术的研究,TP391.41
  11. H.264并行编码算法设计及其在GPU上的实现,TP391.41
  12. 基于DSP的单目视觉定位方法关键技术研究,TP391.41
  13. 单张图像去雾研究,TP391.41
  14. 基于哼唱的音乐检索系统,TN912.3
  15. 基于高性能计算的脑电信号分析,R318.0
  16. 基于GPU的密码算法实现技术研究,TP393.08
  17. 基于FPGA的3D图形处理器IP核的设计与实现,TP391.41
  18. 基于计算机视觉的三维重建技术研究,TP391.41
  19. LMCCD影像像点自动量测技术研究,TP391.41
  20. 基于GPU的医学图像三维重建算法及其应用,TP391.41
  21. 基于GPU的程序分析与并行化研究,TP332

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com