学位论文 > 优秀研究生学位论文题录展示
唇读中的特征提取、选择与融合
作 者: 张盛平
导 师: 姚鸿勋
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 唇读 特征提取 特征选择 特征融合 Gabor小波变换 AdaBoost 流形学习
分类号: TP391.41
类 型: 硕士论文
年 份: 2008年
下 载: 125次
引 用: 3次
阅 读: 论文下载
内容摘要
唇读是利用计算机来识别唇动序列的一门技术,它涉及到模式识别、人工智能、图像处理等多个领域。本文主要研究了单视觉通道下,唇读中的特征提取、选择与融合,主要研究工作包括:1.在特征提取方面,分析了流形学习这种非线性的特征提取方法在唇读中的应用。为了有效提取出唇动过程中的本质特征,本文分析了两种流形学习方法(Isomap和局部线性内嵌(LLE))在唇读中的应用。最初提出的Isomap和LLE方法对于训练集以外的新样本没有一种好的方法能找到其内嵌表示,本文提出了基于核的Isomap和LLE方法,实验结果表明,利用流形这种非线性特征提取方法达到的识别性能虽然要低于传统的基于线性的特征提取方法,但通过流形学习得到的低维内嵌相比于传统的方法更能够反映出唇动的本质特征。2.在特征选择方面,提出了一种基于AdaBoost的最优Gabor核选择算法。Gabor变换因其良好的识别性能在模式识别领域得到了较高的认可。但利用Gabor变换提取出来的特征维数太高,导致所需训练样本的个数显著增加,限制了其在唇读中的应用。考虑到嘴唇区域的表观对称性和Gabor核函数的方向性,本文提出了一种基于AdaBoost的最优Gabor核选择算法。提出的方法首先将嘴唇区域对称地划分成四个子块,在每个子块上利用AdaBoost自适应的选择具有最优判别能力的Gabor核函数。实验表明,所选择的Gabor核函数与嘴唇区域的表观具有一致的方向性。最终产生的特征向量的维数明显降低,达到了优于传统方法的性能。3.在特征融合方面,提出了一种在分类器级融合全局特征和局部特征的方法。在过去的文献中,大量的基于像素的特征提取方法被提出来。传统的特征提取方法只利用了全局特征或局部特征。然而一些心理学的研究表明,人类在识别物体时,不仅利用了全局特征也利用了局部特征,并且在从局部分析物体之前先利用了全局特征。基于这些研究,本文提出了一种在分类器级融合全局与局部特征的方法,全局分类器利用离散傅里叶变换(DFT)来提取全局特征,局部分类器利用分块的Gabor小波变换来提取局部特征。最终的分类器将全局和局部分类器的输出联合得到最终的判别结果。实验结果表明提出的方法要明显优于传统的基于局部特征的分类器或基于全局特征的分类器。
|
全文目录
摘要 4-6 Abstract 6-10 第1章 绪论 10-19 1.1 课题背景及意义 10-12 1.1.1 课题来源 10 1.1.2 课题背景 10-12 1.1.3 课题研究目的和意义 12 1.2 课题在国内外研究综述 12-17 1.2.1 唇读面临的基本问题 13-16 1.2.2 国内外唇读研究动态 16-17 1.3 本文的主要研究内容 17-19 第2章 基于核的流形特征提取方法 19-31 2.1 流形学习概述 20-22 2.1.1 流形和流形学习 21-22 2.1.2 流形学习的分类 22 2.2 流形学习的主要算法 22-26 2.2.1 Isomap方法 23-24 2.2.2 LLE算法 24-26 2.3 基于核流形学习的特征提取方法 26-27 2.4 实验结果 27-29 2.5 本章小结 29-31 第3章 基于AdaBoost的自适应最优Gabor核选择 31-45 3.1 基于分块的Gabor小波变换 31-34 3.1.1 Gabor小波变换 31-33 3.1.2 基于分块的Gabor变换 33-34 3.2 AdaBoost算法简介 34-36 3.3 隐马尔可夫模型中的样本选择 36-41 3.3.1 隐马尔可夫模型的定义 36-37 3.3.2 隐马尔可夫模型在唇读中的应用 37-40 3.3.3 基于样本选择的隐马尔可夫模型 40-41 3.4 基于AdaBoost的自适应最优Gabor核选择 41 3.5 实验结果 41-43 3.6 本章小结 43-45 第4章 全局特征与局部特征融合 45-52 4.1 基于全局特征分析 45-48 4.1.1 离散傅里叶变换 45-46 4.1.2 离散余弦变换 46-47 4.1.3 离散KL变换 47-48 4.2 基于局部的特征分析 48 4.3 全局特征和局部特征的融合 48-50 4.4 实验结果 50-51 4.5 本章小结 51-52 结论 52-54 参考文献 54-58 攻读硕士学位期间发表的学术论文 58-60 致谢 60
|
相似论文
- 基于流形学习的高维流场数据分类研究,V231.3
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 舌体特征的提取及融合分类方法研究,TP391.41
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|