学位论文 > 优秀研究生学位论文题录展示
SIFT与BIM特征提取方法的研究与应用
作 者: 张志毅
导 师: 金连文
学 校: 华南理工大学
专 业: 通信与信息系统
关键词: 尺度不变特征变换 SIFT 生物启发模型 BIM 手写汉字识别
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 444次
引 用: 3次
阅 读: 论文下载
内容摘要
在信息时代,对海量的图像信息进行有效的分类是社会的迫切需求之一。目标分类的研究任务就是探寻对图像数据进行分类的有效方法。所以目标分类成为了当前计算机科学的最热门的研究课题之一。在目标分类系统中,图像特征提取被认为是最关键的模块,因此学者们对如何提取优秀的图像特征进行了大量的研究工作,并取得了许多优秀的研究成果并提取了许多特征提取算法。其中,Scale-Invariant Feature Transform(简称SIFT)与Biological-Inspired Model(简称BIM)算法是两种非常有代表性的特征提取算法。本论文的研究工作围绕这两种算法来展开,其内容包括对SIFT算法与BIM算法的理论研究与实现细节分析、SIFT在脱机手写识别中的应用和BIM在人脸表情识别中的应用三个部分。首先,本文研究了尺度不变特征变换算法,即SIFT算法的理论与分析了其实现细节。SIFT算法分为SIFT特征检测算法与SIFT描述子两部分。SIFT特征检测算法是一种基于尺度空间理论的特征定位算法,其使用了高斯差分空间进行特征定位;而SIFT描述子则是一种基于梯度直方图的图像特征区域描述。然后,本文研究了SIFT在脱机汉字识别中的应用。本文结合手写汉字图像的特点与SIFT描述子,提出了两种有效的脱机手写汉字特征:局部汉字SIFT特征和全局汉字SIFT特征。前者是通过弹性切分把汉字图像切分成一系列图块,然后分别对各图块提取SIFT描述子特征;而后者先使用全局弹性网格把汉字图像划分成数个子区域,然后分别统计子区域相关的梯度信息。将这两种SIFT特征与原始的SIFT特征、手写汉字识别领域中常用的梯度和Gabor特征进行对比,实验结果表明,本文提出的两种SIFT特征性能与梯度特征不相上下,且明显优于Gabor特征与原始的SIFT特征。此外,本文指出了基于弹性网格的SIFT汉字特征具有尺度性,并研究了多种尺度下的SIFT汉字特征的融合性能。最后,本文对生物启发模型特征(BIM特征)的理论与实现细节进行研究,然后将BIM特征应用于人脸表情识别,并对BIM各种特征参数对性能的影响进行了研究,实验结果表明BIM特征在人脸表情识别上有不俗的性能。
|
全文目录
摘要 6-7 ABSTRACT 7-12 第一章 绪论 12-21 1.1 图像特征 12-14 1.2 图像特征提取算法研究现状 14-18 1.2.1 特征检测算法 14-16 1.2.2 特征描述算法 16-18 1.2.3 综合算法 18 1.3 SIFT算法与BIM算法 18-19 1.4 人机智能感知技术 19 1.5 本文的主要工作与内容安排 19-21 第二章 SIFT特征概述 21-37 2.1 尺度空间理论简介 21-24 2.1.1 高斯尺度空间 22-24 2.2 SIFT特征检测算法 24-31 2.3 SIFT描述子 31-33 2.4 特征点配准 33-34 2.5 SIFT的应用与变体 34-35 2.5.1 PCA-SIFT 34-35 2.5.2 Color Descriptors 35 2.5.3 Affine-SIFT 35 2.6 本章小结 35-37 第三章 基于SIFT的手写汉字特征 37-64 3.1 主流脱机汉字特征介绍 37-42 3.1.1 弹性网格方向特征的一般原理 37-38 3.1.2 Gabor特征 38-40 3.1.3 梯度特征 40-42 3.2 基于SIFT的手写汉字特征 42-47 3.2.1 SIFT特征点检测算法的不足 42-43 3.2.2 局部汉字SIFT特征 43-44 3.2.3 全局汉字SIFT特征 44-47 3.3 分类器与特征降维 47-52 3.3.1 最小欧氏距离分类器 47-49 3.3.2 LDA特征降维 49-50 3.3.3 MQDF分类器 50-52 3.4 汉字SIFT特征性能评估实验 52-58 3.4.1 实验数据库 52-53 3.4.2 不同切分参数下的识别性能对比 53-55 3.4.3 大样本数据下不同特征提取方法的对比 55-56 3.4.4 使用MQDF分类器的实验结果对比 56-57 3.4.5 算法复杂度分析 57 3.4.6 讨论:从生物视觉理论来分析梯度特征 57-58 3.5 多尺度汉字特征融合 58-59 3.5.1 汉字特征的尺度性 58 3.5.2 多尺度特征融合 58-59 3.6 多尺度特征融合实验 59-62 3.6.1 无加权融合 60-61 3.6.2 加权融合 61-62 3.6.3 结果分析 62 3.7 本章小结 62-64 第四章 BIM特征研究与应用 64-84 4.1 初级视觉皮层的识别模型概述 64-69 4.1.1 建模对象 65-66 4.1.2 结构描述 66-67 4.1.3 选择性与不变性操作 67-69 4.1.4 学习规则 69 4.2 BIM算法实现描述与实现细节 69-74 4.2.1 S1层 70-71 4.2.2 C1层 71-72 4.2.3 S2层 72-73 4.2.4 C2层 73-74 4.2.5 学习阶段 74 4.3 人脸表情识别简介 74-77 4.3.1 人脸表情识别的基本处理过程 75-76 4.3.2 预处理简述 76-77 4.4 BIM算法在表情识别中的应用 77-82 4.4.1 实验数据库简介 77-79 4.4.2 二项分类实验 79-80 4.4.3 多类分类实验 80-82 4.5 本章小结 82-84 结论 84-86 总结 84-85 展望 85-86 参考文献 86-92 攻读硕士学位期间取得的研究成果 92-93 致谢 93-94 答辩委员会对论文的评定意见 94
|
相似论文
- 基于特征描述的图像匹配方法研究,TP391.41
- 基于最近邻及相似度测量检测钓鱼网页技术的研究,TP393.08
- 基于相似性测量检测图像型垃圾邮件技术的研究,TP393.098
- 基于图形处理器的SIFT算法研究,TP391.41
- 基于SIFT的数字水印算法研究,TP309.7
- 基于BoW-SIFT模型和层次网格特征的三维检索系统,TP391.41
- 基于多幅图像的几何和纹理自动重建,TP391.41
- 基于显著度抠像的图像检索研究与实现,TP391.41
- 基于SIFT特征和SVM的场景分类,TP391.41
- 基于图像配准的沙粒旋转角度计算方法,TP391.41
- 图像制导模拟器图像生成研究,TP391.41
- 多光谱遥感图像配准与融合方法研究,TP751
- 基于SIFT算法单双目视觉结合的移动机械臂定位研究,TP241
- 动态场景下运动目标检测与跟踪,TP391.41
- 抗几何攻击图像水印算法研究,TP309.7
- 基于多标签学习的图像区域语义自动标注算法研究,TP391.41
- C-SIFT算法在视频目标跟踪中的应用研究,TP391.41
- 特征点匹配技术在无人机影像匹配中的研究与应用,TP391.41
- 数字化技术与建筑设计表达,TU201
- 基于详图描述和建筑性能分析的BIM设计流程研究,TU201.4
- 基于辐射与空间信息的遥感图像检索,TP751
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|