学位论文 > 优秀研究生学位论文题录展示

基于HMM-ANN混合模型的咳嗽音识别研究

作 者: 郑晓平
导 师: 石锐
学 校: 重庆大学
专 业: 计算机软件与理论
关键词: 咳嗽音识别 HMM-ANN混合模型 带抑噪技术的MFCC
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 53次
引 用: 1次
阅 读: 论文下载
 

内容摘要


咳嗽作为呼吸系统疾病最常见的症状,其频率、强度、种类、持续时间等参数为临床提供了重要信息。现阶段在对咳嗽评估时通常只是根据病人的主诉,缺少客观测量及定量评估的标准和分析系统。随着语音识别与人工智能的广泛应用,人们迫切希望在对咳嗽音分析与评估方面能实现真正的人机交互,让机器能够像人类那样听懂咳嗽音信号,并对检测识别出来的咳嗽音完成进一步的研究与分析工作。本文参考国内外语音识别技术和咳嗽音研究现状,通过对隐马尔科夫模型(HMM)和人工神经网络(ANN)的分析,将HMM-ANN混合模型应用于咳嗽音识别,并在MATLAB平台下进行仿真实验。本文主要内容有:1本文在分析咳嗽音产生的机理及在声学上的各类特性的基础上对咳嗽音进行预处理。结合咳嗽音的特点,对整个预处理过程中的采样,滤波,预加重,分帧加窗,端点检测等步骤进行研究。2本文分析了线性预测系数、线性预测倒谱系数(LPCC)和Mel频率倒谱系(MFCC)。通过实验对比发现,基于人耳特性的MFCC在咳嗽音识别上更优于基于声道模型的LPCC。为了更好的反映咳嗽音的动态特性,抑制噪音对咳嗽音的影响,本文对MFCC进行二次特征提取,并将RASTA与MFCC相结合,改进对数函数转换,即把带噪声抑制的标准MFCC+一阶差分作为咳嗽音的特征参数。仿真实验表明,相对于其它三种参数,带抑噪技术的MFCC+一阶差分参数对于咳嗽音信号的识别效果有所改善。3本文利用HMM较好的时序建模能力以及ANN强大的分类能力,即将HMM中的Viterbi解码后的所有状态累积概率作为神经网络的输入,经过神经网络非线性映射输出最后结果,建立咳嗽音HMM-ANN混合模型,研究了咳嗽音在混合模型基础上的学习和识别算法。基于上述研究,在MATLAB平台下对整个咳嗽音识别流程进行仿真实验,结果表明基于混合模型的咳嗽音识别性能得到一定程度的提升。

全文目录


中文摘要  3-4
英文摘要  4-9
1 绪论  9-15
  1.1 研究背景与意义  9-10
  1.2 咳嗽音识别技术的研究现状  10-14
    1.2.1 语音识别研究历史及其发展  10-11
    1.2.2 国内外咳嗽音识别研究现状  11-14
  1.3 本文研究内容  14-15
    1.3.1 研究内容与目标  14
    1.3.2 论文结构安排  14-15
2 咳嗽音识别的基本原理与技术分析  15-28
  2.1 咳嗽识别系统框架与概述  15-16
  2.2 系统性能的评估  16
  2.3 咳嗽产生机理及其特征分析  16-19
    2.3.1 咳嗽的产生机理  16-17
    2.3.2 咳嗽音的时域特性  17-18
    2.3.3 咳嗽音的频域特性  18-19
    2.3.4 咳嗽音短时平稳性  19
  2.4 咳嗽音预处理  19-27
    2.4.1 采样  19
    2.4.2 滤波  19-20
    2.4.3 预加重  20-22
    2.4.4 分帧加窗  22-25
    2.4.5 端点检测  25-27
  2.5 本章小结  27-28
3 咳嗽信号的特征选择与提取  28-35
  3.1 简介  28
  3.2 特征参数LPC  28-29
  3.3 线性预测倒谱系数LPCC  29
  3.4 MFCC 特征参数  29-32
    3.4.1 MFCC 参数的提取  30-31
    3.4.2 差分MFCC 参数的提取  31
    3.4.3 咳嗽声特征选取  31-32
  3.5 抑噪技术  32-34
    3.5.1 RASTA 技术  32-33
    3.5.2 带噪声抑制的MFCC  33-34
  3.6 本章小结  34-35
4 HMM-ANN 混合模型及其在咳嗽音识别中的应用  35-52
  4.1 隐马尔可夫模型  35-41
    4.1.1 隐马尔可夫模型的数学描述  36
    4.1.2 HMM 的三个基本问题  36-40
    4.1.3 建立咳嗽音HMM 模型的原理  40-41
    4.1.4 HMM 的不足及其解决方法  41
  4.2 人工神经网络  41-45
    4.2.1 人工神经网络的基本要素  42-43
    4.2.2 人工神经网络学习算法  43
    4.2.3 BP 神经网络  43-45
  4.3 基于HMM-ANN 混合模型的语音识别系统  45-51
    4.3.1 识别系统的基本原理  45-46
    4.3.2 HMM-ANN 混合模型的训练  46-49
    4.3.3 HMM-ANN 混合模型的识别  49-51
  4.4 本章小结  51-52
5 仿真实验及结果讨论  52-61
  5.1 仿真实验原理  52
  5.2 实验数据样本  52
  5.3 预处理  52-54
  5.4 HMM-ANN 结构  54
  5.5 咳嗽音混合模型中HMM 的训练  54-55
  5.6 咳嗽音混合模型中ANN 训练  55-56
  5.7 咳嗽音混合模型的识别  56-57
  5.8 不同特征参数对检测结果的影响  57-58
  5.9 抑噪技术对分类结果的影响  58-59
  5.10 咳嗽音在HMM 模型与HMM-ANN 模型的实验对比  59
  5.11 本章小结  59-61
6 结论与探讨  61-63
  6.1 结论  61
  6.2 探讨  61-63
致谢  63-64
参考文献  64-67
附录 作者在攻读学位期间发表的论文目录  67

相似论文

  1. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  2. 基于DSP的机器人语音命令识别系统研制,TN912.34
  3. 基于多重分形的语音情感识别研究,TN912.34
  4. 基于MIDI的乐器控制系统和音符的自动识别方法研究,TN912.34
  5. 基于VC++6.0的说话人识别系统的研究,TN912.34
  6. 语音情感识别研究,TN912.34
  7. 语音识别置信度研究,TN912.34
  8. 基于说话人识别的公安语音筛选系统设计与实现,TN912.34
  9. 基于语音信号的情绪识别研究,TN912.34
  10. 连续语音中关键词快速检出的研究,TN912.34
  11. 基于元音长度调整的中文语音识别,TN912.34
  12. 与文本无关的开集说话人识别技术研究,TN912.34
  13. 语音识别置信度特征提取算法研究,TN912.34
  14. 说话人识别算法研究及SOPC设计,TN912.34
  15. 语音识别算法及应用技术研究,TN912.34
  16. 基于DSP的车载语音识别系统研究与实现,TN912.34
  17. 语音识别算法研究及实现,TN912.34
  18. 3-5岁听障儿童连续语音重复能力的特征及干预研究,TN912.34
  19. 基于云计算的语音输入方案研究,TN912.34
  20. 压缩域鲁棒音乐识别算法研究,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com