学位论文 > 优秀研究生学位论文题录展示

SIFT与BIM特征提取方法的研究与应用

作 者: 张志毅
导 师: 金连文
学 校: 华南理工大学
专 业: 通信与信息系统
关键词: 尺度不变特征变换 SIFT 生物启发模型 BIM 手写汉字识别
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 444次
引 用: 3次
阅 读: 论文下载
 

内容摘要


在信息时代,对海量的图像信息进行有效的分类是社会的迫切需求之一。目标分类的研究任务就是探寻对图像数据进行分类的有效方法。所以目标分类成为了当前计算机科学的最热门的研究课题之一。在目标分类系统中,图像特征提取被认为是最关键的模块,因此学者们对如何提取优秀的图像特征进行了大量的研究工作,并取得了许多优秀的研究成果并提取了许多特征提取算法。其中,Scale-Invariant Feature Transform(简称SIFT)与Biological-Inspired Model(简称BIM)算法是两种非常有代表性的特征提取算法。本论文的研究工作围绕这两种算法来展开,其内容包括对SIFT算法与BIM算法的理论研究与实现细节分析、SIFT在脱机手写识别中的应用和BIM在人脸表情识别中的应用三个部分。首先,本文研究了尺度不变特征变换算法,即SIFT算法的理论与分析了其实现细节。SIFT算法分为SIFT特征检测算法与SIFT描述子两部分。SIFT特征检测算法是一种基于尺度空间理论的特征定位算法,其使用了高斯差分空间进行特征定位;而SIFT描述子则是一种基于梯度直方图的图像特征区域描述。然后,本文研究了SIFT在脱机汉字识别中的应用。本文结合手写汉字图像的特点与SIFT描述子,提出了两种有效的脱机手写汉字特征:局部汉字SIFT特征和全局汉字SIFT特征。前者是通过弹性切分把汉字图像切分成一系列图块,然后分别对各图块提取SIFT描述子特征;而后者先使用全局弹性网格把汉字图像划分成数个子区域,然后分别统计子区域相关的梯度信息。将这两种SIFT特征与原始的SIFT特征、手写汉字识别领域中常用的梯度和Gabor特征进行对比,实验结果表明,本文提出的两种SIFT特征性能与梯度特征不相上下,且明显优于Gabor特征与原始的SIFT特征。此外,本文指出了基于弹性网格的SIFT汉字特征具有尺度性,并研究了多种尺度下的SIFT汉字特征的融合性能。最后,本文对生物启发模型特征(BIM特征)的理论与实现细节进行研究,然后将BIM特征应用于人脸表情识别,并对BIM各种特征参数对性能的影响进行了研究,实验结果表明BIM特征在人脸表情识别上有不俗的性能。

全文目录


摘要  6-7
ABSTRACT  7-12
第一章 绪论  12-21
  1.1 图像特征  12-14
  1.2 图像特征提取算法研究现状  14-18
    1.2.1 特征检测算法  14-16
    1.2.2 特征描述算法  16-18
    1.2.3 综合算法  18
  1.3 SIFT算法与BIM算法  18-19
  1.4 人机智能感知技术  19
  1.5 本文的主要工作与内容安排  19-21
第二章 SIFT特征概述  21-37
  2.1 尺度空间理论简介  21-24
    2.1.1 高斯尺度空间  22-24
  2.2 SIFT特征检测算法  24-31
  2.3 SIFT描述子  31-33
  2.4 特征点配准  33-34
  2.5 SIFT的应用与变体  34-35
    2.5.1 PCA-SIFT  34-35
    2.5.2 Color Descriptors  35
    2.5.3 Affine-SIFT  35
  2.6 本章小结  35-37
第三章 基于SIFT的手写汉字特征  37-64
  3.1 主流脱机汉字特征介绍  37-42
    3.1.1 弹性网格方向特征的一般原理  37-38
    3.1.2 Gabor特征  38-40
    3.1.3 梯度特征  40-42
  3.2 基于SIFT的手写汉字特征  42-47
    3.2.1 SIFT特征点检测算法的不足  42-43
    3.2.2 局部汉字SIFT特征  43-44
    3.2.3 全局汉字SIFT特征  44-47
  3.3 分类器与特征降维  47-52
    3.3.1 最小欧氏距离分类器  47-49
    3.3.2 LDA特征降维  49-50
    3.3.3 MQDF分类器  50-52
  3.4 汉字SIFT特征性能评估实验  52-58
    3.4.1 实验数据库  52-53
    3.4.2 不同切分参数下的识别性能对比  53-55
    3.4.3 大样本数据下不同特征提取方法的对比  55-56
    3.4.4 使用MQDF分类器的实验结果对比  56-57
    3.4.5 算法复杂度分析  57
    3.4.6 讨论:从生物视觉理论来分析梯度特征  57-58
  3.5 多尺度汉字特征融合  58-59
    3.5.1 汉字特征的尺度性  58
    3.5.2 多尺度特征融合  58-59
  3.6 多尺度特征融合实验  59-62
    3.6.1 无加权融合  60-61
    3.6.2 加权融合  61-62
    3.6.3 结果分析  62
  3.7 本章小结  62-64
第四章 BIM特征研究与应用  64-84
  4.1 初级视觉皮层的识别模型概述  64-69
    4.1.1 建模对象  65-66
    4.1.2 结构描述  66-67
    4.1.3 选择性与不变性操作  67-69
    4.1.4 学习规则  69
  4.2 BIM算法实现描述与实现细节  69-74
    4.2.1 S1层  70-71
    4.2.2 C1层  71-72
    4.2.3 S2层  72-73
    4.2.4 C2层  73-74
    4.2.5 学习阶段  74
  4.3 人脸表情识别简介  74-77
    4.3.1 人脸表情识别的基本处理过程  75-76
    4.3.2 预处理简述  76-77
  4.4 BIM算法在表情识别中的应用  77-82
    4.4.1 实验数据库简介  77-79
    4.4.2 二项分类实验  79-80
    4.4.3 多类分类实验  80-82
  4.5 本章小结  82-84
结论  84-86
  总结  84-85
  展望  85-86
参考文献  86-92
攻读硕士学位期间取得的研究成果  92-93
致谢  93-94
答辩委员会对论文的评定意见  94

相似论文

  1. 基于特征描述的图像匹配方法研究,TP391.41
  2. 基于最近邻及相似度测量检测钓鱼网页技术的研究,TP393.08
  3. 基于相似性测量检测图像型垃圾邮件技术的研究,TP393.098
  4. 基于图形处理器的SIFT算法研究,TP391.41
  5. 基于SIFT的数字水印算法研究,TP309.7
  6. 基于BoW-SIFT模型和层次网格特征的三维检索系统,TP391.41
  7. 基于多幅图像的几何和纹理自动重建,TP391.41
  8. 基于显著度抠像的图像检索研究与实现,TP391.41
  9. 基于SIFT特征和SVM的场景分类,TP391.41
  10. 基于图像配准的沙粒旋转角度计算方法,TP391.41
  11. 图像制导模拟器图像生成研究,TP391.41
  12. 多光谱遥感图像配准与融合方法研究,TP751
  13. 基于SIFT算法单双目视觉结合的移动机械臂定位研究,TP241
  14. 动态场景下运动目标检测与跟踪,TP391.41
  15. 抗几何攻击图像水印算法研究,TP309.7
  16. 基于多标签学习的图像区域语义自动标注算法研究,TP391.41
  17. C-SIFT算法在视频目标跟踪中的应用研究,TP391.41
  18. 特征点匹配技术在无人机影像匹配中的研究与应用,TP391.41
  19. 数字化技术与建筑设计表达,TU201
  20. 基于详图描述和建筑性能分析的BIM设计流程研究,TU201.4
  21. 基于辐射与空间信息的遥感图像检索,TP751

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com