学位论文 > 优秀研究生学位论文题录展示

多视角的唇动身份识别研究

作 者: 林晓鑫
导 师: 姚鸿勋
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 多视角 身份识别 嘴唇运动 特征提取
分类号: TP391.41
类 型: 硕士论文
年 份: 2009年
下 载: 15次
引 用: 0次
阅 读: 论文下载
 

内容摘要


基于多视角的唇动的身份识别技术,是多视角人脸识别和正面唇动身份识别的生物特征识别技术的延伸和组合。说话时的唇动信息,既体现了说话人嘴唇的固有生理特点,也反映了运动变化的个性行为特点,为进行身份识别提供了充分的有用信息。而多视角的唇动身份识别不仅补充了单一视角的缺陷,同时消除了对使用者造成的视角的限制。作为研究的基础,本文首先构建了基于多视角的唇动识别语料库(HIT-AVDB-II),该语料库录制于不同的光照条件下,涵盖多种语言、多种背景等。在嘴唇检测方面,我们针对多视角的特点,采用自适应的颜色空间转换和水平集方法相结合的方法,提高了轮廓获取的准确度。为了解决视频分割不同步的问题,采用了曲线的面积覆盖和的方法,进行唇动曲线同步。在特征提取和模型构建上,首先用DCT和SCHMM相结合的方法。针对图像的嘴唇部分进行DCT变换,采用低频分量构建“eigenlip”,然后使用SCHMM构建说话人模型。实验结果表明直接使用图像表观特征进行身份识别时,图像的信息贡献度随视角的变化而变化。然后使用嘴唇运动轨迹的作为特征,通过嘴唇轮廓的运动曲线和曲线的高阶信息的结合,利用曲线相关度模型,分别针对文本有关和文本无关进行身份识别。最后我们引入了时空体的概念,从时间轴和嘴唇上下运动方向轴获取时空体切片,用直方图提取全局特征,进行直方图特征连接,模型构建采用SVM方法。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-19
  1.1 课题研究的背景和意义  8-12
    1.1.1 课题来源  8
    1.1.2 课题背景  8-11
    1.1.3 课题研究目的和意义  11-12
  1.2 多视角唇动身份识别技术综述  12-17
    1.2.1 唇动身份识别技术的基本问题  12-15
    1.2.2 本课题国内外研究情况概述  15-17
  1.3 本文的主要研究内容  17-19
第2章 多视角唇动身份识别数据库构建  19-26
  2.1 已有的唇读说话人识别数据库  19-20
  2.2 唇动身份识别数据库的建立  20-24
    2.2.1 关键词的选择和采集方法  20-22
    2.2.2 语料库的采集  22-24
  2.3 语料库实验规则  24-25
  2.4 本章小结  25-26
第3章 多视角的唇区轮廓获取和视频同步  26-38
  3.1 多视角的唇区特点  26
  3.2 多视角的唇区检测和轮廓提取  26-33
    3.2.1 基于颜色空间变换处理  27-29
    3.2.2 基于水平集的方法轮廓提取方法  29-33
  3.3 多视角的唇动视频同步  33-37
  3.4 本章小结  37-38
第4章 基于表观特征的说话人识别方法  38-45
  4.1 DCT 特征提取技术  38-39
    4.1.1 DCT 基本原理  38-39
    4.1.2 DCT 特征提取实现  39
  4.2 HMM 模型  39-41
    4.2.1 建模原理和依据  39-40
    4.2.2 建模的技术要点和实现  40-41
    4.2.3 建模技术的应用  41
  4.3 实验和结果  41-44
    4.3.1 实验流程  41-42
    4.3.2 测试流程  42
    4.3.3 结果和结果分析  42-44
  4.4 本章小结  44-45
第5章 基于唇动轨迹特征的识别方法  45-52
  5.1 多视角的唇动轮廓特征提取  45-48
    5.1.1 多视角轮廓提取方法实现  45-46
    5.1.2 运动轮廓曲线后处理  46-47
    5.1.3 运动曲线速度和加速度求取  47-48
  5.2 曲线相关度计算模型  48-50
    5.2.1 曲线相关度模型原理  48-49
    5.2.2 基于嘴唇运动曲线的识别研究  49-50
  5.3 实验和结果  50-51
  5.4 本章小结  51-52
第6章 基于时空体直方图特征的识别方法  52-58
  6.1 多视角特征不变量  52-53
  6.2 基于时空体的特征提取  53-55
    6.2.1 基于直方图的唇动特征提取方法  54
    6.2.2 基于直方图的特征提取方法具体实现  54-55
  6.3 实验和结果  55-57
  6.4 本章小结  57-58
结论  58-59
参考文献  59-63
附录识别平台界面  63-64
攻读学位期间发表的学术论文  64-66
致谢  66

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  4. Q学习在基于内容图像检索技术中的应用,TP391.41
  5. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  6. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  7. 空间交会接近视觉测量方法研究,TP391.41
  8. 图像实时采集、存储与处理方法研究,TP391.41
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 多币种纸币处理技术的研究与实现,TP391.41
  11. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 移动机器人视觉检测和跟踪研究,TP242.62
  14. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  15. 基于随机森林的植物抗性基因识别方法研究,Q943
  16. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  17. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  18. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  19. 红外图像目标识别及跟踪技术研究,TP391.41
  20. 水下目标特征的压缩与融合技术研究,TN911.7
  21. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com