学位论文 > 优秀研究生学位论文题录展示

仿人眼的结构原理和关键视觉技术研究

作 者: 张阳
导 师: 王宣银
学 校: 浙江大学
专 业: 机械电子工程
关键词: 仿生人眼 多孔道球支撑 视觉注意模型 单目立体视觉 电子稳像 图像压缩 拟人视觉
分类号: TP391.41
类 型: 博士论文
年 份: 2011年
下 载: 631次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在现代工程技术领域中,视觉信息采集与处理具有重要的科学意义。研究人员参考人眼视觉原理,发明感知视觉图像信息的传感器,建立基于计算机技术的图像处理理论体系,开创机器视觉这一崭新研究领域。机器视觉技术已经在先进制造系统、机器人系统、智能监控、航天军工等领域广泛应用。但是多数视觉平台仅实现基本视觉功能,与真实人眼功能差异大。由于人眼具有强大的视觉信息处理能力,因此对人眼生理特性深入分析将使机器视觉研究具有更加充实的理论基础,推动机器视觉技术的发展。本文针对人眼特性研究,提出并联驱动仿生人眼机构模型;对前庭系统图像稳定机制、视觉信息注意机制以及单眼立体成像功能等方面进行深入分析和应用研究,提出仿入视觉特性的机器视觉处理理论和方法,进行建模仿真和实验分析,主要内容如下:第一章,阐述本课题的相关研究背景、目的和意义,介绍了人眼视觉系统的基本组成及特性,对国内外仿生人眼系统及仿人眼视觉理论研究的内容和现状进行了阐述,最后分析了仿生视觉系统及拟人视觉应用研究所面临的主要问题,给出了本课题的主要研究内容。第二章,针对广义人眼系统功能特性进行分析,建立了仿生人眼机电系统模型;提出了仿生人眼结构的假设条件和模拟人眼的多孔道球支撑结构;依据仿生学设计原理,提出了一种基于柔性执行器并联驱动的仿生人眼结构模型,包含六条模仿眼外肌的执行元件、视觉传感器及姿态检测传感器,并且根据机械加工需求选取了尺寸系统参数;针对人眼最重要的扫视运动特性进行分析,利用并联仿生人眼运动学模型和扫视运动特性,以及所设计的仿生人眼机构对典型的扫视运动进行了模拟仿真,得到了双眼运动路径及执行器运动参数;第三章,针对摄像机异常运动对视觉连续采集的影响进行研究,分析了保证视觉连续采集稳定处理原理和方法,研究视频连续采集稳定原理。在人眼前庭动反射的启发下,分析人眼视频稳定的机理,研究了摄像机异常运动在成像平面上所反映出的规律,提出了异常运动短时预测方法。在平均分布的子空间提取特征,利用预测结果确定搜索起始点进行匹配运算,有效减小图像内容中运动目标对稳像结果的影响。分析视频稳定后导致图像部分边缘信息丢失的现象,研究人眼的视觉暂留机理,提出以时间间隔为依据对当前帧空域所丢失内容进行线性化叠加恢复,保证视频主观判断的完整性。第四章,对人眼视觉注意机制和视网膜成像的中心-四周机制进行分析,建立基于初级视觉特征融合的视觉注意机制计算模型,提出了一种基于非线性中心-四周多尺度特征提取的计算方法,得到分辨率非线性变化的各尺度图像提取特征图。根据各初级视觉特征的自身特点及对视觉注意机制的不同作用,提出了一种基于权重系数的显著图叠加方法。对注意感知机制在视觉信息压缩处理中的应用进行研究,提出一种基于图像注视区域的压缩系数可变图片压缩算法,利用人眼视觉成像的多分辨率特性,采用Log-Polar函数设定压缩系数过渡策略,有效的降低了图片的存储空间。第五章,分析人眼视觉注意机制对运动目标的初级特征提取特性,提出了利用高斯模型进行背景建模提取运动目标作为感兴趣区域的算法,将背景与目标分割。经典DPCM编码压缩模型中整幅图像量化矩阵固定,本文提出了一种依据关注目标设置压缩量化矩阵的算法,设计量化矩阵过渡策略,降低视觉噪声,通过编解码端传递运动区域坐标和几何信息等少量数据的策略,保证编解码端数据一致性。第六章,分析人眼立体视觉成像机理,研究分析单眼立体视觉功能,进行合理假设,提出了一种基于单目视觉的立体建模和测量模型。通过光学原理和几何学基础,分析单一像平面对空间目标进行立体成像的可行性。对立体测量中的特征提取等数字图像处理方法进行研究,提出了一种新的利用颜色空间特性的圆形特征标记提取与亚像素中心定位算法。依据空间目标特征点在多幅变倍图像中投影的几何关系和特性,提出了一种1-D空间特征匹配搜索算法,将二维图像内容的匹配降低到一维空间。建立虚拟摄像机及实验环境模型,通过建模参数与单目立体视觉图像处理算法结果进行比较,验证了算法的正确性和可行性;与传统立体视觉方法进行比较分析,提出课题算法的特点和适合应用场合。第七章对全文作了总结,阐述了本课题的研究结论和创新点,对后续研究工作做出了展望。

全文目录


致谢  5-7
摘要  7-10
Abstract  10-24
第1章 绪论  24-42
  1.1 课题研究的目的和意义  24-26
    1.1.1 课题来源与研究背景  24-25
    1.1.2 课题研究的目的和意义  25-26
  1.2 人类视觉系统组成及视觉机理研究现状  26-31
    1.2.1 人类视觉系统生理解剖结构  27
    1.2.2 眼球的运动机理及形式  27-30
    1.2.3 人眼的视觉机理  30-31
  1.3 仿人眼生理机制的视觉系统研究现状  31-38
    1.3.1 仿人视觉采集系统研究现状  31-33
    1.3.2 仿人视觉图像处理应用研究现状  33-37
    1.3.3 视觉计算模型数字处理关键技术  37-38
  1.4 仿生人眼及拟人视觉研究的关键科学问题  38-40
  1.5 主要研究内容  40-41
  1.6 本章小结  41-42
第2章 并联驱动仿生人眼结构建模及运动特性分析  42-53
  2.1 引言  42
  2.2 广义人眼功能分析及仿生人眼系统研究  42-44
    2.2.1 人眼主要功能及特性研究与分析  43-44
    2.2.2 仿生人眼系统整体建模  44
  2.3 多孔道并联仿人眼机构研究  44-47
    2.3.1 仿生人眼设计依据和假设  44-45
    2.3.2 气动肌肉执行器分析  45
    2.3.3 仿生人眼传感系统设计  45-46
    2.3.4 尺寸参数选择策略  46
    2.3.5 多孔道并联驱动仿生眼结构设计  46-47
  2.4 仿人眼扫视运动分析及模拟研究  47-52
    2.4.1 人眼同向扫视运动特性分析  47-48
    2.4.2 多孔道并联驱动仿人眼运动学模型分析  48-51
    2.4.3 仿生人眼扫视运动数值模拟分析  51-52
  2.5 本章小结  52-53
第3章 仿人眼视频稳定获取技术研究  53-83
  3.1 引言  53-54
  3.2 连续视频不稳定机理研究  54-57
    3.2.1 像平面异常运动对视频采集的影响  54-56
    3.2.2 视频稳像与模糊图像恢复  56-57
    3.2.3 连续视频稳定方法  57
  3.3 电子稳像原理及关键问题  57-59
    3.3.1 电子稳像原理研究  57-58
    3.3.2 电子稳像关键科学问题  58-59
  3.4 人眼视觉信息获取机理研究  59-61
    3.4.1 前庭系统机理  59-60
    3.4.2 视觉暂留机制  60-61
  3.5 可预测均布特征运动估计方法研究  61-75
    3.5.1 可预测均布子空间特征提取匹配方法  61
    3.5.2 均布子空间特征提取  61-64
    3.5.3 视频运动参数预测算法研究  64-66
    3.5.4 混合模板两步搜索算法  66-68
    3.5.5 运动平滑与运动补偿  68-69
    3.5.6 实验研究  69-75
  3.6 边缘区域视觉暂留处理机制  75-81
    3.6.1 边缘区域缺陷分析  75-76
    3.6.2 视觉暂留图像恢复原理  76-78
    3.6.3 图像边缘数据补偿算法  78-79
    3.6.4 边缘补偿实验研究  79-81
  3.7 本章小结  81-83
第4章 视觉注意模型及注视区域提取算法研究  83-105
  4.1 引言  83
  4.2 人眼视觉注意机制  83-87
    4.2.1 人眼视觉注意特性分析  84-85
    4.2.2 人眼视觉注意系统的生理学模型  85-87
    4.2.3 人眼视觉注意机制的心理学模型  87
  4.3 视觉注意机制建模  87-91
    4.3.1 视觉注意机制处理模型  87-88
    4.3.2 视觉注意机制感兴趣图生成方法  88-90
    4.3.3 视觉注意机制研究中的关键问题  90-91
  4.4 人眼视觉采样机制  91-92
    4.4.1 人眼的非均匀采样机制  91
    4.4.2 非均匀采样机制的离散化  91-92
    4.4.3 仿生视觉对数极坐标映射原理  92
  4.5 图像注意目标提取的显著性优先算法  92-96
    4.5.1 初级特征显著图生成方法  92-94
    4.5.2 兴趣图构建方法  94-96
  4.6 基于数据驱动注视模型图片压缩算法  96-99
    4.6.1 标准JPEG算法原理  96-97
    4.6.2 注视模型区域的JPEG图像压缩算法  97-98
    4.6.3 注视区域量化系数  98-99
  4.7 实验研究与结果分析  99-104
    4.7.1 实验研究  99-103
    4.7.2 结果分析  103-104
  4.8 本章小节  104-105
第5章 基于人眼注意模型的视频视觉冗余消除方法  105-124
  5.1 引言  105
  5.2 连续视频冗余性分析  105-107
    5.2.1 空间冗余  106
    5.2.2 时间冗余  106-107
    5.2.3 视觉冗余  107
  5.3 消除冗余信息的视频编码压缩原理  107-111
    5.3.1 混合DPCM视频编码模型  108-109
    5.3.2 编码数据压缩与损失分析  109-110
    5.3.3 视频编码性能评价标准  110-111
  5.4 人眼视觉感兴趣图像检测算法  111-113
    5.4.1 视频背景建模  111-112
    5.4.2 运动目标检测  112
    5.4.3 运动目标位置和区域计算  112-113
  5.5 基于视觉运动注意的视觉冗余压缩算法  113-115
    5.5.1 编码压缩流程  113
    5.5.2 量化矩阵系数计算方法  113-114
    5.5.3 编解码端一致性策略  114-115
  5.6 实验结果及分析  115-123
    5.6.1 测试方法与视频  115-116
    5.6.2 感兴趣区域检测结果  116-117
    5.6.3 编码视频结果  117-119
    5.6.4 感兴趣区域视觉效果比较  119-120
    5.6.5 压缩比与峰值信噪比比较  120-122
    5.6.6 实验结果分析  122-123
  5.7 本章小结  123-124
第6章 单目立体视觉1-D特征匹配算法及实验研究  124-141
  6.1 引言  124
  6.2 人眼立体成像原理研究  124-127
    6.2.1 目立体视觉原理  124-125
    6.2.2 单眼立体视觉线索分析  125-127
  6.3 单目立体成像模型  127-131
    6.3.1 单目立体成像光学原理  127-129
    6.3.2 立体目标的建模  129-131
  6.4 单相机立体测量技术研究  131-135
    6.4.1 单摄像头立体测量流程  131-132
    6.4.2 圆点特征提取与定位  132-134
    6.4.3 特征投影点1-D最优分布匹配算法  134-135
  6.5 单目立体视觉实验研究  135-139
    6.5.1 点目标空间几何关系测量实验研究  135-137
    6.5.2 虚拟环境立体目标建模实验研究  137
    6.5.3 立体测量实验  137-139
    6.5.4 实验结果分析  139
  6.6 本章小结  139-141
第7章 总结与展望  141-145
  7.1 全文总结  141-143
  7.2 论文创新点  143
  7.3 展望  143-145
参考文献  145-157
作者简历及攻读博士学位期间的主要科研成果  157-159

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  3. 电子稳像系统中旋转稳像算法研究,TP391.41
  4. 图像的稀疏表示及编码模型研究,TP391.41
  5. 远程医疗系统图像压缩及传输关键技术研究,R318.0
  6. 偏远地区配电变压器防盗监控系统的设计,TM421
  7. 基于小波的雷达视频压缩方法研究,TN957.52
  8. 基于DM6446与小波的图像压缩系统设计与实现,TP391.41
  9. 鞍山供电机房视频监控系统,TP391.41
  10. 脑部CT图像的压缩应用,TP391.41
  11. 复杂目标视觉注意模型研究,TP391.41
  12. 一种基于SPIHT改进的ROI图像编码方法,TN919.81
  13. 基于混沌和分形的两类图像处理算法,TP391.41
  14. 基于认知特征的服装风格自主分类的研究与实现,TS941.11
  15. 图像压缩网络终端的设计,TP391.41
  16. 几种分形图像压缩方法研究,TP391.41
  17. 基于DM6446的电子稳像技术研究与实现,TP391.41
  18. 利用小波变换与优化截断的嵌入式块编码进行图像压缩,TP391.41
  19. 基于视觉特性及人工神经网络的图像压缩,TP391.41
  20. 基于小波变换的图像压缩并行算法研究,TP391.41
  21. 基于小波变换的图像压缩编码研究,TN919.81

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com