学位论文 > 优秀研究生学位论文题录展示

基于HMM和PNN的混合语音识别模型研究

作 者: 童佳宁
导 师: 王社国
学 校: 河北工程大学
专 业: 计算机应用技术
关键词: 语音识别 语音处理 隐马尔可夫模型 概率神经网
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 44次
引 用: 1次
阅 读: 论文下载
 

内容摘要


语音识别是一门集语言学、信号处理、计算机技术于一身的综合性学科。其广阔的应用前景,广泛的应用领域使大量的科学研究人员长期以来一直关注着它,并投入大量精力对其进行研究。其中基于HMM优秀的时域建模能力以及ANN强大的分类能力的理论研究已在语音识别领域取得了出色的表现。本文对现有语音识别技术的发展进行了分析,详细介绍了语音识别的基本理论,包括组成、分类、预处理、特征提取以及双门限检测法等常用方法。并对线性预测倒谱系数和Mel频率倒谱系数的原理及提取过程做了较深入的研究。重点对HMM模型和PNN的原理及其在语音识别中的应用进行了研究,并就其各自的识别特性与优缺点进行了分析比较。将HMM强大的时域建模能力和PNN优秀的分类能力相互补偿,提出了基于HMM和PNN的混合模型和算法,即使用VQ作为HMM的前端,对二次提取后的LPCC参数和MFCC参数进行矢量量化,将量化后的结果作为HMM的输入。在此基础上通过Viterbi解码产生的状态转移积累输出作为PNN的输入,由PNN输入得到最终的识别结果。本文在Matlab7.0环境下对HMM和HMM/PNN模型进行了特定人、非特定人识别仿真,并在加噪的条件下对两种模型的识别率进行了比较。由仿真得到的识别数据可证明,与传统的HMM相比,该混合模型的识别性能更优,在抗噪性能上也优于HMM。

全文目录


摘要  6-7
Abstract  7-10
第1章 绪论  10-15
  1.1 课题研究的意义  10-11
  1.2 国内外研究现状  11-13
    1.2.1 国外研究现状  11-12
    1.2.2 国内研究现状  12-13
  1.3 语音识别的研究难点  13
  1.4 本文章节安排  13-15
第2章 语音识别基础理论知识  15-29
  2.1 概述  15
  2.2 语音识别的分类  15
  2.3 语音的产生与感知  15-16
    2.3.1 发声机理  15-16
    2.3.2 人耳听觉特征  16
  2.4 语音信号的声学模型  16-18
    2.4.1 激励模型  17
    2.4.2 声道模型  17-18
    2.4.3 辐射模型  18
  2.5 语音识别系统的基本组成  18-23
    2.5.1 对语音信号进行预处理  18-20
    2.5.2 端点检测  20
    2.5.3 特征参数  20-23
  2.6 常用语音识别方法  23-27
    2.6.1 动态时间规整(DTW)  23-26
    2.6.2 矢量量化(VQ)  26-27
  2.7 本章小结  27-29
第3章 隐马尔可夫模型与概率神经网  29-50
  3.1 隐马尔可夫模型  29-46
    3.1.1 定义及说明  29-30
    3.1.2 HMM 的类型  30-31
    3.1.3 缸球模型  31-32
    3.1.4 HMM 算法  32-36
    3.1.5 隐马尔可夫模型的算法实现  36-45
    3.1.6 基于HMM 的语音识别  45-46
    3.1.7 HMM 的不足  46
  3.2 概率神经网  46-49
    3.2.1 PNN 的结构  46-48
    3.2.2 简易 PNN 仿真  48-49
    3.2.3 PNN 的优点  49
  3.3 本章小结  49-50
第4章 HMM/PNN 结合的语音识别系统  50-62
  4.1 HMM 与 PNN 的结合构想  50
  4.2 隐马尔可夫模型与概率神经网混合模型的实现及仿真  50-62
    4.2.1 仿真实验的基本流程  50-52
    4.2.2 实现框架  52
    4.2.3 预处理过程  52-55
    4.2.4 参数提取  55-59
    4.2.5 矢量量化  59-60
    4.2.6 Viterbi 算法  60-61
    4.2.7 时间规整  61
    4.2.8 本章小结  61-62
第5章 仿真结果与分析  62-65
  5.1 实验结果比较  62-64
  5.2 本章小结  64-65
结论  65-66
参考文献  66-70
致谢  70-71
作者简介  71
攻读硕士学位期间发表的论文和科研成果  71-72

相似论文

  1. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  2. 基于DSP的机器人语音命令识别系统研制,TN912.34
  3. 在智能手机环境下健康管理功能设计与研究,TN929.53
  4. 呼叫中心IVR系统的设计与实现,TN99
  5. 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
  6. 基于STRAIGHT谱的语音识别算法研究,TN912.34
  7. 语音处理芯片的后端设计与关键技术研究,TN402
  8. 基于嵌入式的特定人语音识别智能轮椅设计,TP368.12
  9. 基于稳健性PLPC的抗噪语音识别方法的研究,TN912.34
  10. 研制咳嗽记录分析仪的前期研究,R725.6
  11. 基于语音结构化模型的连续数字语音识别,TN912.34
  12. 基于HMM模型的混合特征参数语音识别方法的研究,TN912.34
  13. 一种基于子带最大似然线性回归的鲁棒语音识别方法,TN912.34
  14. 基于单片机的语音识别系统研究,TN912.34
  15. 基于麦克风阵列的语音增强与识别研究,TN912.35
  16. 关于表音密码提高初中生语音处理能力的实证研究,G633.41
  17. 文化算法优化RBF神经网络及应用研究,TP183
  18. 基于遗传算法的计算机辅助语音处理研究,TN912.3
  19. 一种语音与超声波一体的智能无线驱鸟器设计与实现,TP368.12
  20. 基于DSP的自适应噪声抵消技术的研究,TN911.4

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com