学位论文 > 优秀研究生学位论文题录展示

用于设备控制的语音识别系统的研究

作 者: 李苗苗
导 师: 柳晓鸣
学 校: 大连海事大学
专 业: 通信与信息系统
关键词: 语音控制 语音识别 端点检测 DTW算法
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 240次
引 用: 4次
阅 读: 论文下载
 

内容摘要


现代社会中机器在人们的生活中无处不见,现在以键盘为主的人机交互界面必须手眼并用的操作,而且比较难度,技术度比较高。为此就需要研究一种更加友好方便的人机交互界面。语音是人类交流最自然方便的方式。通过语音对机器进行控制可以使人机交互的效率大大的提高。要实现人机的语音交互就必须提高语音识别的实用性,本文所做的就是语音识别控制技术的研究。本文研究设计了一个特定人、小词汇量、孤立词语音识别控制系统。本论文分析和比较了动态时间规整(DTW)和隐马尔柯夫模型(HMM)两种识别算法的优缺点。考虑到系统的要求是设计出一个特定人、小词汇量孤立词语音识别系统,动态时间规整(DTW)可以满足系统的设计要求,因此算法选定为动态时间规整。该算法的思想就是将动态规划的思想用于解决语音识别中的语速多变的问题,使得未知单词的时间轴不均匀的扭曲或弯折,以便使其特征与模板特征对正。识别的过程就是将语音信号进行预处理后,提取语音信号特征,采用一定的测度,计算识别语音与模板语音的失真,确定识别结果。本文对基于DTW算法的小词汇量语音识别系统进行了系统设计,关键技术研究,进行了软件设计,论文重点研究了对孤立词语音识别意义重大的端点检测技术,并对当前最常用的几种特征参数:LPC、LPCC、MFCC参数进行了详细研究,并选取MFCC做为本研究的特征参数。针对DTW算法存在的两个最大的缺陷:一是对端点的敏感性;二是运算量较大;对传统的算法上进行了改进,提高了运行速度,取得了很好的效果。软件系统通过双线程实现了对语音信号的实时采集和识别。本文最后通过Matlab仿真对识别系统进行了性能测试。仿真所使用的数据是采用麦克风,利用成熟的计算机声卡技术采集语音信号。本文重点对数字和开、关等命令词进行了端点检测的仿真和DTW语音识别的仿真,得到很好的识别效果。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-16
  1.1 课题的提出和研究意义  10-11
  1.2 语音识别技术的在国内外的发展概述  11-13
  1.3 语音识别系统的分类  13-14
  1.4 研究内容和方法  14
  1.5 研究成果  14-15
  1.6 论文结构  15-16
第2章 语音识别系统设计  16-31
  2.1 系统目标的确立  16
  2.2 语音识别系统设计  16-17
  2.3 语音识别系统的预处理模块  17-21
    2.3.1 语音信号的数字化  17
    2.3.2 语音信号的预加重、加窗、分帧  17-19
    2.3.3 语音信号的端点检测  19-21
  2.4 语音识别特征提取模块  21-28
    2.4.1 线性预测系数LPC  21-25
    2.4.2 线性预测倒谱系数LPCC  25-27
    2.4.3 Mel倒谱系数MFCC  27-28
  2.5 语音识别算法选择  28-29
  2.6 基于DTW算法语音控制系统的设计  29-30
  2.7 本章小结  30-31
第3章 语音识别关键技术的研究  31-44
  3.1 语音识别单元选取  31
  3.2 前端抗噪算法研究  31-33
  3.3 MFCC算法研究及改进  33-36
  3.4 语音信号的训练与识别算法研究  36-43
    3.4.1 语音模板库的建立  36
    3.4.2 传统的DTW算法  36-40
    3.4.3 DTW算法改进  40-43
  3.5 本章小结  43-44
第4章 语音识别系统软件设计  44-52
  4.1 语音识别系统程序设计  44-45
  4.2 录音程序设计  45-48
  4.3 语音识别程序设计  48-50
  4.4 本章小结  50-52
第5章 仿真实验及系统评估  52-63
  5.1 实验数据  52-55
  5.2 语音端点检测效果测试  55-56
  5.3 DTW算法及改进算法测试及结果分析  56-63
第6章 结束语  63-64
参考文献  64-67
攻读学位期间公开发表论文  67-68
致谢  68-69
研究生履历  69

相似论文

  1. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  2. 基于DSP的机器人语音命令识别系统研制,TN912.34
  3. 在智能手机环境下健康管理功能设计与研究,TN929.53
  4. 数字助听器中语音增强技术的研究,TN912.35
  5. 移动音视频交互业务执行平台的研究,TN915.09
  6. 基于Android的车载娱乐信息系统,TP311.52
  7. 功率谱估计在宽带ADCP信号检测中的研究与应用,TN911.23
  8. 基于电话信道的声纹识别算法研究,TN912.34
  9. 呼叫中心IVR系统的设计与实现,TN99
  10. 基于HMM的机器人语音识别系统的研究,TN912.34
  11. 基于改进MFCC的语音识别系统研究及设计,TN912.34
  12. 仿真机器人控制系统,TP242
  13. 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
  14. 基于词片网格的语音文档主题分类,TN912.3
  15. 基于HMM和PNN的混合语音识别模型研究,TN912.34
  16. 移动机器人语音识别控制仿真系统的设计与实现,TN912.34
  17. 语音端点检测算法研究及硬件实现,TN912.34
  18. 基于动态贝叶斯网络的连续语音识别研究,TN912.34
  19. 基于STRAIGHT谱的语音识别算法研究,TN912.34
  20. 基于经验模态分解的语音端点检测算法研究,TN912.3
  21. 面向机器人对话的语音识别关键技术的研究,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com