学位论文 > 优秀研究生学位论文题录展示
面向机器人对话的语音识别关键技术的研究
作 者: 刘旸
导 师: 刘志镜;裘国永
学 校: 西安电子科技大学
专 业: 计算机技术
关键词: 机器人 语音识别 隐马尔可夫模型(HMM)
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 118次
引 用: 0次
阅 读: 论文下载
内容摘要
机器人发展至今,对于机器人的控制,语音控制无非是最自然、最便捷的控制方式。从国内外对语音识别技术的研究现状来看,与机器人进行交流,把语音识别技术应用于机器人,正成为目前研究的热点。语音识别技术使机器人能听懂人的自然语言,由识别得到的信息作为声控信号应用到机器人的多种技术领域。将语音识别技术应用于机器人为使用者带来了极大的方便。因此研究并开发实用的机器人语音识别系统对于机器人的广泛应用具有重要的意义。论文的主要内容如下:首先,基于语音识别的基本原理,研究了面向机器人对话的语音识别的关键技术,语音信号的预处理,包括采样、去除噪音、端点检测、预加重、加窗分帧等;对线性预测倒谱系数(LPCC)与Mel频率倒谱系数(MFCC)的性能进行了对比分析;研究了主流的模型训练和模式匹配技术,这是语音识别技术的核心部分,包括隐马尔可夫模型(HMM)、动态时间规整(DTW)、矢量量化(VQ)、人工神经网络(ANN)、HMM和ANN的混合模型等。其次,设计完成了机器人的语音识别控制系统。基于VC++的集成开发环境编写了语音识别控制系统的软件,实现了识别性能较好、执行效率较高的机器人语音指令识别算法。并在AS-R机器人上进行了测试,结合声纳和PSD传感器的使用,大大的提高了机器人的交互性。实验结果表明,实现的语音识别控制系统的识别性能较好。同时,该系统结构简单,性价比高,易于功能扩展和移植,具有广阔的应用前景。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-15 1.1 引言 7 1.2 机器人概述 7-10 1.3 语音识别技术概述 10-11 1.3.1 语音概述 10-11 1.3.2 语音识别技术概述 11 1.4 语音识别技术的研究历史及现状 11-13 1.4.1 语音识别技术的国外研究历史及现状 11-12 1.4.2 语音识别技术的国内研究历史及现状 12-13 1.5 机器人语音识别的意义 13-15 第二章 语音识别基本原理 15-19 2.1 语音识别系统的分类 15-17 2.1.1 根据发音方式 15-16 2.1.2 根据语音词汇量大小 16 2.1.3 根据说话者的限定范围 16-17 2.2 语音识别系统的结构 17-18 2.3 本章小结 18-19 第三章 语音识别的关键技术 19-31 3.1 语音信号的预处理 19-22 3.1.1 语音采样 19 3.1.2 去除噪音 19-20 3.1.3 端点检测的方法 20-21 3.1.4 预加重 21 3.1.5 加窗分帧 21-22 3.2 语音识别的特征参数提取 22-26 3.2.1 线性预测系数 23-24 3.2.2 线性预测倒谱系数(LPCC) 24-25 3.2.3 Mel倒谱系数(MFCC) 25-26 3.3 模型训练和模式匹配 26-30 3.3.1 隐马尔可夫模型(HMM) 26-27 3.3.2 动态时间规整(DTW) 27-28 3.3.3 矢量量化(VQ) 28-29 3.3.4 人工神经网络(ANN) 29-30 3.4 本章小结 30-31 第四章 基于HMM的语音识别方法 31-41 4.1 HMM的基本思想 31-33 4.1.1 Markov链 31-32 4.1.2 HMM的基本概念 32 4.1.3 HMM的定义 32-33 4.2 HMM的类型 33-34 4.2.1 按照HMM的A参数分类 33-34 4.2.2 按照HMM的B参数分类 34 4.3 HMM的基本算法 34-38 4.4 利用HMM算法建立语音模型 38-40 4.4.1 HMM初值的选择 39 4.4.2 HMM的训练 39-40 4.5 本章小结 40-41 第五章 基于AS-R机器人语音识别系统的设计与实现 41-53 5.1 系统概述 41-47 5.1.1 系统设计目标 41 5.1.2 系统设计流程 41-42 5.1.3 系统功能设计 42-47 5.1.3.1 语音识别模块 42 5.1.3.2 运动控制模块 42-45 5.1.3.3 人机对话模块 45-46 5.1.3.4 自主导航模块 46-47 5.1.3.5 简单追踪模块 47 5.2 实验用机器人简介 47-49 5.3 系统界面设计 49-51 5.4 实验结果及系统评价 51-52 5.4.1 实验结果 51-52 5.4.2 系统评价 52 5.5 本章小结 52-53 第六章 结论与展望 53-55 致谢 55-57 参考文献 57-58
|
相似论文
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 统计机器翻译中结构转换技术的研究,TP391.2
- FPGA/DSP图像协处理技术及以太网数据传输,TP391.41
- 面向统计机器翻译的解码算法的研究,TP391.2
- PCB视觉检测系统中相机标定算法与位姿测定技术,TP391.41
- 基于ARM的实验机器人控制系统的研制,TP242.6
- 家庭清扫机器人路径覆盖系统的设计与实现,TP242
- 基于全局视觉的仿人机器人足球比赛系统,TP242.6
- 多机器人合作追捕目标问题研究,TP242
- 双足机器人快速步行动力学研究,TP242.6
- 一种新型模块化自重构机器人的研究,TP242.2
- 腹腔介入式手术机器人机械结构设计及运动仿真,TP242.3
- 晶圆传输机器人关键控制技术研究,TP242.2
- 电动六自由度并联机器人的特性分析与控制,TP242.2
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- FROV作业流程仿真技术研究,TP242
- 基于粒子滤波的自主机器人视觉目标跟踪研究,TP242
- 下肢康复机器人的训练规划与康复效果评估,R49
- 基于机器视觉的光纤几何参数检测研究,TN253
- 系统控制理论及其在水下机器人系统中的应用研究,TP13
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|