学位论文 > 优秀研究生学位论文题录展示

唇读识别系统的研究与实现

作　者: 李新
导　师: 刘禾
学　校: 华北电力大学（北京）
专　业: 模式识别与智能系统
关键词: 唇读识别主动外貌模型隐马尔可夫模型
分类号: TP391.41
类　型: 硕士论文
年　份: 2011年
下　载: 45次
引　用: 0次
阅　读: 论文下载

内容摘要

唇读作为自动语音识别的辅助手段,将听觉通道与视觉通道相结合能够比单独听觉通道取得更高的识别率,本文针对基于视频的计算机唇读系统的唇部检测、唇读特征提取和唇读识别等关键技术进行了研究。本文将主动外貌模型和隐马尔可夫模型相结合,提出了一种基于主动外貌模型和隐马尔可夫模型的唇读识别方法和一种能准确找到嘴唇的嘴唇特征点。主动外貌模型用于特征提取,隐马尔可夫模型用于特征序列的识别。在训练阶段,首先利用本文提出的唇标记点集来训练主动外貌模型得到嘴唇的空间分布统计特性；其次通过K-Mean聚类算法将视频高维序列降到一维标量序列作为观察值,来训练隐马尔可夫模型集得到每类发音过程的时间分布统计特性。在识别阶段,用马尔可夫模型集来分析测试视频的时间动态特性,计算出每一模型产生该序列的概率,概率最大的模型就是识别序列所属的类别。对汉语数字进行了识别实验,实验结果表明：该方法识别率较高,是一种具有较好应用前景的识别方法。

全文目录

摘要  5-6
Abstract  6-9
第1章绪论  9-15
  1.1 课题研究的背景和意义  9-10
    1.1.1 课题背景  9-10
    1.1.2 课题研究意义  10
  1.2 国内外唇读识别研究综述  10-13
    1.2.1 国内外研究动态  10-11
    1.2.2 唇读研究的基本问题  11-13
  1.3 本文的研究内容  13-15
第2章基于AAM的特征点定位原理  15-29
  2.1 引言  15
  2.2 AAM建模  15-23
    2.2.1 相关知识准备  16-20
    2.2.2 形状建模  20
    2.2.3 纹理建模  20-22
    2.2.4 混合建模  22-23
  2.3 AAM搜索算法  23-28
    2.3.1 基于线性回归的AAM的搜索算法  25
    2.3.2 基于Lucas-Kanade的搜索算法  25-26
    2.3.3 基于反向组合的AAM的搜索算法  26-28
  2.4 本章小结  28-29
第3章 HMM理论基础  29-41
  3.1 HMM模型的定义  29-31
    3.1.1 HMM模型的信号模型  29
    3.1.2 HMM模型的背景  29-30
    3.1.3 HMM模型的定义  30-31
  3.2 HMM的类型  31-34
    3.2.1 按状态转移情况分类  31-33
    3.2.2 按输出概率形态分类  33-34
  3.3 HMM的三个基本问题及解决方法  34-40
    3.3.1 向前-向后算法  35-37
    3.3.2 Viterbi算法  37-38
    3.3.3 Baum-Welch算法  38-40
  3.4 本章小结  40-41
第4章基于AAM和HMM的唇读识别方法  41-57
  4.1 引言  41-42
    4.1.1 方法选取  41-42
    4.1.2 系统框图  42
  4.2 AAM的实现  42-45
    4.2.1 唇特征点的选取  42-43
    4.2.2 AAM建模和搜索  43-45
    4.2.3 AAM的参数处理  45
  4.3 HMM的实际问题  45-50
    4.3.1 HMM结构类型及状态数的选取  45-46
    4.3.2 HMM初始模型参数的选取  46-47
    4.3.3 多个观察值序列训练  47-48
    4.3.4 比例因子问题  48-50
  4.4 唇读识别系统实现及实验结果  50-56
    4.4.1 HMM建模  50-51
    4.4.2 HMM识别过程  51-52
    4.4.3 唇读识别系统软件设计  52-55
    4.4.4 针对发音0-9的实验结果  55-56
  4.5 本章小结  56-57
第5章总结与展望  57-59
  5.1 总结  57
  5.2 展望  57-59
参考文献  59-63
攻读硕士学位期间发表的论文及其它成果  63-64
致谢  64

唇读识别系统的研究与实现

内容摘要

全文目录

相似论文