学位论文 > 优秀研究生学位论文题录展示

基于HMM和PNN的混合语音识别模型研究

作　者: 童佳宁
导　师: 王社国
学　校: 河北工程大学
专　业: 计算机应用技术
关键词: 语音识别语音处理隐马尔可夫模型概率神经网
分类号: TN912.34
类　型: 硕士论文
年　份: 2010年
下　载: 44次
引　用: 1次
阅　读: 论文下载

内容摘要

语音识别是一门集语言学、信号处理、计算机技术于一身的综合性学科。其广阔的应用前景,广泛的应用领域使大量的科学研究人员长期以来一直关注着它,并投入大量精力对其进行研究。其中基于HMM优秀的时域建模能力以及ANN强大的分类能力的理论研究已在语音识别领域取得了出色的表现。本文对现有语音识别技术的发展进行了分析,详细介绍了语音识别的基本理论,包括组成、分类、预处理、特征提取以及双门限检测法等常用方法。并对线性预测倒谱系数和Mel频率倒谱系数的原理及提取过程做了较深入的研究。重点对HMM模型和PNN的原理及其在语音识别中的应用进行了研究,并就其各自的识别特性与优缺点进行了分析比较。将HMM强大的时域建模能力和PNN优秀的分类能力相互补偿,提出了基于HMM和PNN的混合模型和算法,即使用VQ作为HMM的前端,对二次提取后的LPCC参数和MFCC参数进行矢量量化,将量化后的结果作为HMM的输入。在此基础上通过Viterbi解码产生的状态转移积累输出作为PNN的输入,由PNN输入得到最终的识别结果。本文在Matlab7.0环境下对HMM和HMM/PNN模型进行了特定人、非特定人识别仿真,并在加噪的条件下对两种模型的识别率进行了比较。由仿真得到的识别数据可证明,与传统的HMM相比,该混合模型的识别性能更优,在抗噪性能上也优于HMM。

全文目录

摘要  6-7
Abstract  7-10
第1章绪论  10-15
  1.1 课题研究的意义  10-11
  1.2 国内外研究现状  11-13
    1.2.1 国外研究现状  11-12
    1.2.2 国内研究现状  12-13
  1.3 语音识别的研究难点  13
  1.4 本文章节安排  13-15
第2章语音识别基础理论知识  15-29
  2.1 概述  15
  2.2 语音识别的分类  15
  2.3 语音的产生与感知  15-16
    2.3.1 发声机理  15-16
    2.3.2 人耳听觉特征  16
  2.4 语音信号的声学模型  16-18
    2.4.1 激励模型  17
    2.4.2 声道模型  17-18
    2.4.3 辐射模型  18
  2.5 语音识别系统的基本组成  18-23
    2.5.1 对语音信号进行预处理  18-20
    2.5.2 端点检测  20
    2.5.3 特征参数  20-23
  2.6 常用语音识别方法  23-27
    2.6.1 动态时间规整（DTW）  23-26
    2.6.2 矢量量化（VQ）  26-27
  2.7 本章小结  27-29
第3章隐马尔可夫模型与概率神经网  29-50
  3.1 隐马尔可夫模型  29-46
    3.1.1 定义及说明  29-30
    3.1.2 HMM 的类型  30-31
    3.1.3 缸球模型  31-32
    3.1.4 HMM 算法  32-36
    3.1.5 隐马尔可夫模型的算法实现  36-45
    3.1.6 基于HMM 的语音识别  45-46
    3.1.7 HMM 的不足  46
  3.2 概率神经网  46-49
    3.2.1 PNN 的结构  46-48
    3.2.2 简易 PNN 仿真  48-49
    3.2.3 PNN 的优点  49
  3.3 本章小结  49-50
第4章 HMM/PNN 结合的语音识别系统  50-62
  4.1 HMM 与 PNN 的结合构想  50
  4.2 隐马尔可夫模型与概率神经网混合模型的实现及仿真  50-62
    4.2.1 仿真实验的基本流程  50-52
    4.2.2 实现框架  52
    4.2.3 预处理过程  52-55
    4.2.4 参数提取  55-59
    4.2.5 矢量量化  59-60
    4.2.6 Viterbi 算法  60-61
    4.2.7 时间规整  61
    4.2.8 本章小结  61-62
第5章仿真结果与分析  62-65
  5.1 实验结果比较  62-64
  5.2 本章小结  64-65
结论  65-66
参考文献  66-70
致谢  70-71
作者简介  71
攻读硕士学位期间发表的论文和科研成果  71-72

基于HMM和PNN的混合语音识别模型研究

内容摘要

全文目录

相似论文