学位论文 > 优秀研究生学位论文题录展示

基于非经典感受野机制的图像认知计算模型

作 者: 王晓梅
导 师: 危辉
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 感受野 图像边缘 非经典 计算机视觉 轮廓拟合 表征方式 receptive 亮度梯度 局部信息 图像信息处理 空间频率 视觉信息 计算视觉 边缘处理 图像纹理 视觉感知 视觉算法 图像区域 生理视觉 retinal
分类号: TP391.41
类 型: 博士论文
年 份: 2012年
下 载: 187次
引 用: 0次
阅 读: 论文下载
 

内容摘要


计算机视觉在智能计算机的研究中具有重要的意义。但由于绝大多数计算机视觉的研究者忽略了生理视觉原理,而过多地从工程角度出发提出各种理论和算法,使得计算机视觉缺乏完整的计算理论体系和统一的有效算法,无法解决复杂场景的认知问题。所以当前的计算机视觉实际上只能处理单一的局部信息,但大多数景象都是由多种不同的局部信息组成的。相比之下,高等哺乳动物的视觉感知系统却能够在各种复杂的环境下轻松感知外界信息。当高等哺乳动物观察一个景象时,大脑会很好地组合各种局部视觉信息,产生总体协调的感觉,从非常复杂的背景中辨认出各种尺度、各种特性的物体。所以,通过对高等哺乳动物的视觉处理机制的研究,借助于神经生理和认知心理理论,完全可能找到一些新的突破点,为计算视觉理论提供新的原型,以解决计算机视觉遇到的困难。在视觉系统中,视觉信号的初级处理发生在视网膜(又被称为“外周脑”)。神经节细胞是视网膜信息处理的最后一站。感受野是视觉系统信息处理的基本结构和功能单元,视网膜复杂网络的处理结果和反应特性最终都体现在了神经节细胞的感受野上。它的作用是基础性的,既汇聚了比它低层的信息,又为比它高层的加工环节准备好了素材。因此对神经节细胞信息加工机制的模拟对视觉算法具有显著的启示意义。视网膜神经节具有同心圆拮抗式的经典感受野,其空间整合特性是处理图像区域亮度对比信息、提取图像的边缘信息,但高等动物极其复杂的视觉系统对图像信息的处理绝不仅限于边缘增强,它应该在边缘处理的基础上,尽可能完整地把图像信息传递给大脑。非经典感受野(non-classical receptive field, or nCRF)是在经典感受野(classical receptive field, or CRF)之外的一个大范围区域,单独刺激该区域并不能直接引起细胞的反应,但对经典感受野内刺激所引起的反应有调制作用。视网膜神经节细胞的非经典感受野主要是去抑制性的,因此可以在一定程度上补偿由经典感受野所造成的低空间频率信息的损失,在保持边界增强功能的同时,传递图像的区域亮度梯度信息,显示大面积表面上亮度的缓慢变化。由此可见,非经典感受野大大拓宽了视觉细胞信自、处理的范围,为整合和检测大范围的复杂图形提供了神经基础。研究发现,视网膜神经节细胞(GC)的感受野(RF)随着视觉刺激的不同而发生变化,而以往对视网膜神经节细胞非经典感受野的建模大多基于固定不变的感受野,都没有考虑感受野的动态变化特性。本文对视网膜神经节细胞非经典感受野的基本结构建立了多层次、带反馈的神经计算模型,并模拟眼睛的固视微动和视觉系统自上而下的反馈作用以探知相邻区域内的刺激属性。在本文构造的层次网络计算模型中:视网膜神经节细胞的经典感受野周边区和去抑制性非经典感受野是由一些小的亚区组成,能解释去抑制作用的内在神经机制;神经节细胞的感受野是动态变化的,它能根据刺激的性质进行自动调节,在图像的边界和需要精细分辨的细节处缩小,在变化不大的连续区域处扩大,从而实现对图像纹理块的自动分析与提取;设计的神经回路得到神经生物学证据的支持,能说明去抑制性非经典感受野与视网膜神经回路的关系;所设计的神经回路包括自顶向下的主动调控,并参考刺激的邻域属性,能够由神经元同步响应而实现整合和主动选择功能,从而实现完整系统内部各个神经元之间的协调作用:模拟神经节细胞的阵列来实现图像的通用表征,促进后续更高级别的图像信息处理。用本文构造的层次网络计算模型对自然图像进行通用表征实验,结果表明,在图像的相邻区域内,相似的地方被整合在一起,用一个大的感受野进行表征,而不相似的地方被分开,用若干个小的感受野进行表征,并且表征忠于原图。在原图和表征图像上分别进行分割实验,结果表明,与对原图的分割相比,对表征图像的分割不仅速度快、效率高,而且效果更好。另外,在表征图像上进行聚类实验和轮廓拟合实验,都得到了很好的结果。因此,本文构造的层次网络计算模型的确为后续高级加工(如分割问题等)提供了良好的基础,有助于促进对图像的理解。

全文目录


摘要  4-6
ABSTRACT  6-9
第一章 绪论  9-13
  1.1 效法自然  9-11
  1.2 论文结构  11-13
第二章 模拟神经机制的计算视觉研究  13-18
  2.1 对视觉神经机制的模拟历史  13-16
  2.2 对已有工作存在问题的总结  16-18
第三章 非经典感受野机制  18-28
  3.1 经典感受野的生理学研究  18-22
  3.2 非经典感受野的生理学研究  22-23
  3.3 视网膜神经节细胞的非经典感受野神经机制  23-24
  3.4 视网膜的逆向调控机制  24-25
  3.5 固视微动  25
  3.6 对非经典感受野已有工作的总结  25-28
第四章 三层网络模型  28-36
  4.1 模型设计  28-31
  4.2 实验结果  31-34
  4.3 本章小结  34-36
第五章 多层次网络计算模型设计  36-52
  5.1 计算回路设计  37-39
  5.2 层次网络模型设计  39-41
  5.3 GC感受野的数学模型  41-42
  5.4 参数设置  42-49
    5.4.1 GC感受野取值范围的确定  42-43
    5.4.2 计算GC的CRF中心区半径所对应的像素个数  43-45
    5.4.3 A_1和ΔS_1的取值  45-47
    5.4.4 A(?)·ΔS(?)和A_3·△S_3的取值  47-49
  5.5 动态感受野设计  49-52
第六章 图像表征的相关实验  52-66
  6.1 一致性实验  52-54
  6.2 简洁性实验  54-58
  6.3 忠实性实验  58-66
第七章 通用表征对图像理解的促进实验  66-77
  7.1 聚类促进实验  66-68
  7.2 分割促进实验  68-72
    7.2.1 GC阵列提高了分割的效率  68-70
    7.2.2 N-cut对比实验  70-72
  7.3 轮廓拟合实验  72-77
第八章 结论  77-80
  8.1 本文创新点  77
  8.2 对语义表征的启示  77-78
  8.3 进一步的工作  78-80
参考文献  80-92
致谢  92-93
攻读博士期间发表的论文  93-94

相似论文

  1. 基于学习的低阶视觉问题研究,TP391.41
  2. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  3. 基于空间—频率域的织物组织识别新技术研究,TS101.923
  4. 基于计算机视觉对“次郎”甜柿外部品质检测与分级的研究,S665.2
  5. 基于计算机视觉的脱水蒜片检测与分级研究,TP391.41
  6. 基于运动目标轨迹分析的智能交通监控系统,TP277
  7. 一种基于人眼视觉掩蔽特性和Contourlet的水印算法研究,TP309.7
  8. 数字新媒体时代下的图片编辑研究,G232.2
  9. 基于计算机视觉的手写输入法研究,TP391.14
  10. 基于DSP的水稻杂草识别研究,TP391.41
  11. 基于特征点匹配的障碍物检测算法的研究与实现,U463.6
  12. 融合运动补偿与特征信息的障碍物检测算法研究,TP391.41
  13. 变化盲视中的突现效应及其影响因素,TP391.41
  14. 基于计算机视觉的浇注流量的间接测量方法研究,TP274
  15. 便携式下棋机器人系统的设计与实现,TP242
  16. 基于计算机视觉的带钢表面缺陷在线检测系统的设计与实现,TP391.41
  17. 基于计算机视觉的织物疵点检测与分类方法的研究,TP274
  18. 基于计算机视觉的手势交互系统的设计与实现,TP391.41
  19. 高尔夫球童机器人视觉跟踪模块设计,TP242.62
  20. 高能束快速制造中计算机视觉技术应用的研究,TP391.41
  21. 基于生物视沉感知机理的轮廓检测算法研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com