学位论文 > 优秀研究生学位论文题录展示
基于声控小车的语音识别算法研究
作 者: 李景川
导 师: 董慧颖
学 校: 沈阳理工大学
专 业: 控制理论与控制工程
关键词: 孤立词 端点检测 特征提取 模板匹配 语音控制
分类号: TP391.42
类 型: 硕士论文
年 份: 2009年
下 载: 248次
引 用: 2次
阅 读: 论文下载
内容摘要
随着语音识别技术的不断发展,语音控制也随之得到越来越多的技术人员的关注。语音控制技术的关键就在于,不仅要让机器人听懂人在说什么,而且还要让机器人知道要去做什么。本文就是基于语音控制技术,针对小词汇量孤立词语音识别系统进行研究。本论文主要从两个方面进行论述,一方面从理论的角度讨论了语音识别的原理和语音的声学模型,并结合原理和声学模型对小词汇量孤立词识别系统中各主要部分的算法进行研究。另一方面,从系统实现的角度对足球机器人平台及软件平台进行了说明。本系统语音识别算法中主要有三大部分构成:端点检测、特征参数提取、模板匹配。端点检测部分,本文对用于小词汇量孤立词识别系统中的短时能量短时过零率算法进行了算法描述并给出了仿真结果,在此基础上,又对其改进算法进行仿真,通过实验数据做出了算法的比较。特征提取部分,本文主要介绍了三种语音特征参数:线性预测编码系数、线性预测编码倒谱系数和Mel频率倒谱系数,对三种算法分别进行了仿真实验,并进行了算法的比较。模板匹配部分,即识别部分,本文论述了动态时间弯折算法,动态时间弯折的改进算法和隐马尔可夫模型算法。由于本系统基于小词汇量孤立词,所以识别算法采用基于模板匹配的动态时间弯折的改进算法。软件平台采用VC-MATLAB混合编程,对足球机器人小车进行语音控制,实验取得了较好的识别控制效果。
|
全文目录
摘要 6-7 Abstract 7-10 第1章 绪论 10-16 1.1 课题背景及意义 10 1.2 国内外研究现状与存在的问题 10-15 1.2.1 国内外研究现状 10-14 1.2.2 面临的问题 14-15 1.3 本文的主要内容及各章内容概述 15-16 1.3.1 本文的主要内容 15 1.3.2 各章内容概述 15-16 第2章 声学原理及孤立词识别概述 16-23 2.1 声学原理 16-19 2.1.1 语音的声学分析 16-17 2.1.2 语音信号的特性 17 2.1.3 语音的产生 17-18 2.1.4 wav 音频格式简介 18-19 2.2 小词汇量孤立词语音识别方法概述 19-22 2.2.1 语音识别系统构成 19-20 2.2.2 识别方法简介 20-22 2.3 本章小结 22-23 第3章 端点检测 23-35 3.1 端点检测研究背景 23-24 3.1.1 端点检测的主要作用 23-24 3.1.2 端点检测对识别系统的影响 24 3.2 预处理 24-28 3.2.1 预加重 24-25 3.2.2 加窗分帧 25-26 3.2.3 短时能量 26-27 3.2.4 短时平均过零率 27-28 3.3 端点检测算法 28-34 3.3.1 短时能量短时平均过零率双门限端点检测算法 28-31 3.3.2 传统端点检测算法的改进 31-34 3.4 本章小结 34-35 第4章 特征提取 35-44 4.1 特征参数概述 35 4.2 线性预测编码(LPC)系数 35-41 4.2.1 LPC 算法基本思想 36-38 4.2.2 LPC 算法的实现 38-39 4.2.3 LPC 线性预测编码倒谱系数 39-41 4.3 MFCC 系数 41-43 4.3.1 MFCC 算法基本思想 41-42 4.3.2 MFCC 算法的实现 42-43 4.4 本章小结 43-44 第5章 识别算法 44-58 5.1 DTW 44-47 5.1.1 动态时间弯折(DTW)基本原理 44 5.1.2 DTW 算法的实现 44-47 5.2 DTW 算法的改进 47-49 5.3 HMM 49-53 5.3.1 隐马尔可夫链 50-51 5.3.2 隐马尔可夫模型的基本概念 51-53 5.3.3 应用HMM 需解决的问题 53 5.4 硬件平台简介 53-55 5.5 软件平台简介 55-57 5.6 本章小结 57-58 结论 58-60 参考文献 60-63 攻读硕士学位期间发表的论文和获得的科研成果 63-64 致谢 64
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 红外图像目标识别及跟踪技术研究,TP391.41
- 水下目标特征的压缩与融合技术研究,TN911.7
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com
|