学位论文 > 优秀研究生学位论文题录展示

唇读识别系统的研究与实现

作 者: 李新
导 师: 刘禾
学 校: 华北电力大学(北京)
专 业: 模式识别与智能系统
关键词: 唇读识别 主动外貌模型 隐马尔可夫模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 45次
引 用: 0次
阅 读: 论文下载
 

内容摘要


唇读作为自动语音识别的辅助手段,将听觉通道与视觉通道相结合能够比单独听觉通道取得更高的识别率,本文针对基于视频的计算机唇读系统的唇部检测、唇读特征提取和唇读识别等关键技术进行了研究。本文将主动外貌模型和隐马尔可夫模型相结合,提出了一种基于主动外貌模型和隐马尔可夫模型的唇读识别方法和一种能准确找到嘴唇的嘴唇特征点。主动外貌模型用于特征提取,隐马尔可夫模型用于特征序列的识别。在训练阶段,首先利用本文提出的唇标记点集来训练主动外貌模型得到嘴唇的空间分布统计特性;其次通过K-Mean聚类算法将视频高维序列降到一维标量序列作为观察值,来训练隐马尔可夫模型集得到每类发音过程的时间分布统计特性。在识别阶段,用马尔可夫模型集来分析测试视频的时间动态特性,计算出每一模型产生该序列的概率,概率最大的模型就是识别序列所属的类别。对汉语数字进行了识别实验,实验结果表明:该方法识别率较高,是一种具有较好应用前景的识别方法。

全文目录


摘要  5-6
Abstract  6-9
第1章 绪论  9-15
  1.1 课题研究的背景和意义  9-10
    1.1.1 课题背景  9-10
    1.1.2 课题研究意义  10
  1.2 国内外唇读识别研究综述  10-13
    1.2.1 国内外研究动态  10-11
    1.2.2 唇读研究的基本问题  11-13
  1.3 本文的研究内容  13-15
第2章 基于AAM的特征点定位原理  15-29
  2.1 引言  15
  2.2 AAM建模  15-23
    2.2.1 相关知识准备  16-20
    2.2.2 形状建模  20
    2.2.3 纹理建模  20-22
    2.2.4 混合建模  22-23
  2.3 AAM搜索算法  23-28
    2.3.1 基于线性回归的AAM的搜索算法  25
    2.3.2 基于Lucas-Kanade的搜索算法  25-26
    2.3.3 基于反向组合的AAM的搜索算法  26-28
  2.4 本章小结  28-29
第3章 HMM理论基础  29-41
  3.1 HMM模型的定义  29-31
    3.1.1 HMM模型的信号模型  29
    3.1.2 HMM模型的背景  29-30
    3.1.3 HMM模型的定义  30-31
  3.2 HMM的类型  31-34
    3.2.1 按状态转移情况分类  31-33
    3.2.2 按输出概率形态分类  33-34
  3.3 HMM的三个基本问题及解决方法  34-40
    3.3.1 向前-向后算法  35-37
    3.3.2 Viterbi算法  37-38
    3.3.3 Baum-Welch算法  38-40
  3.4 本章小结  40-41
第4章 基于AAM和HMM的唇读识别方法  41-57
  4.1 引言  41-42
    4.1.1 方法选取  41-42
    4.1.2 系统框图  42
  4.2 AAM的实现  42-45
    4.2.1 唇特征点的选取  42-43
    4.2.2 AAM建模和搜索  43-45
    4.2.3 AAM的参数处理  45
  4.3 HMM的实际问题  45-50
    4.3.1 HMM结构类型及状态数的选取  45-46
    4.3.2 HMM初始模型参数的选取  46-47
    4.3.3 多个观察值序列训练  47-48
    4.3.4 比例因子问题  48-50
  4.4 唇读识别系统实现及实验结果  50-56
    4.4.1 HMM建模  50-51
    4.4.2 HMM识别过程  51-52
    4.4.3 唇读识别系统软件设计  52-55
    4.4.4 针对发音0-9的实验结果  55-56
  4.5 本章小结  56-57
第5章 总结与展望  57-59
  5.1 总结  57
  5.2 展望  57-59
参考文献  59-63
攻读硕士学位期间发表的论文及其它成果  63-64
致谢  64

相似论文

  1. 反向合成图像对齐算法的研究及改进,TP391.41
  2. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  3. 基于FPGA的高速图像预处理技术的研究,TP391.41
  4. 2D人脸模板保护算法研究,TP391.41
  5. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  6. 图像拼接技术研究,TP391.41
  7. 高效精确字符串匹配算法的研究与实现,TP391.41
  8. 基于三维重建的焊点质量分类方法研究,TP391.41
  9. 舌体特征的提取及融合分类方法研究,TP391.41
  10. 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
  11. 空中目标与背景的红外图像仿真技术研究,TP391.41
  12. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  13. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  14. 双传感器图像联合目标检测及系统实现研究,TP391.41
  15. 雾天或背光条件下图像清晰化算法研究及硬件实现,TP391.41
  16. 基于纹理特征的视频编码技术研究,TP391.41
  17. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  18. Q学习在基于内容图像检索技术中的应用,TP391.41
  19. 基于多示例学习的用户关注概念区域发现,TP391.41
  20. 二维粗糙表面光散射特性模拟与实验研究,TP391.41
  21. JPEG图像的透明安全性研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com