学位论文 > 优秀研究生学位论文题录展示
基于语音的机器人控制应用研究
作 者: 续芳
导 师: 王宇俊
学 校: 西南大学
专 业: 计算机应用技术
关键词: 机器人 语音识别 动态时间规整 隐马尔可夫模型 语音控制
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 134次
引 用: 2次
阅 读: 论文下载
内容摘要
自从工业机器人投入应用以来,它已经在社会生产制造等许多领域中发挥了巨大的作用。目前,各种娱乐、示教、服务类型的机器人正在走进我们的日常生活,它们也将为我们的生活带来很多的方便和乐趣。语音一直是我们日常生活最惯常自然的信息交流方式,实现人机间的语音通信就显得必不可少,进行语音控制的研究工作具有很强的现实意义和应用前景。论文的主要工作是从特定人和非特定人两个方面对机器人语音控制问题进行研究。在特定人的语音识别技术方面,对经典的特定人的语音识别技术(即动态时间规整的语音识别技术,Dynamic Time Warping,简称DTW)进行了深入研究,针对两个方面的问题:1、传统DTW算法在语音识别过程中涉及到大量的计算会影响系统的响应速度;2、由于端点检测方法不能十分精准的判断语音信号的起始点,如果DTW严格对齐端点来匹配则会产生一定的识别误差。对此文章提出了结合搜索宽度限制和放松端点限制的方法对传统DTW算法进行改进,并通过实验验证了改进后的DTW在识别速度和识别率上都有很大的提高。其次,在非特定人语音识别技术方面,文章研究了现行最流行基于隐马尔可夫模型的非特定人语音识别技术。深入分析了算法的产生基础、思想、算法的三个基本问题及相应的解决方法。其中语音训练过程产生的语音模型很大程度上决定了系统的识别性能,因此文章结合了平滑模型参数技术和模型参数重估计方法对语音的模型参数进行了优化改进。实验结果表明对模型参数优化改进后能取得更好的语音识别效果。最后文章说明了机器人动作的设计过程,采用无线蓝牙技术实现了计算机和机器人之间的通讯,使机器人动作控制更具灵活性。在上述工作的基础上,结合VC++6.0和Matlab编程实现了对机器人特定人的语音控制,使用VC++6.0和HTK软件包编程实现了对机器人非特定人的语音控制,测试结果表明两者都达到了对机器人理想的语音控制效果。
|
全文目录
摘要 5-6 ABSTRACT 6-8 第一章 绪论 8-12 1.1 研究背景和意义 8 1.2 语音识别技术的发展现状 8-9 1.3 语音识别系统的分类及性能指标 9-10 1.4 本文的主要工作 10-11 1.5 论文的组织结构 11-12 第二章 语音识别的理论基础 12-22 2.1 语音的产生及数字模型 12-14 2.2 语音信号处理基础 14-19 2.2.1 语音信号的预处理 14-16 2.2.2 语音信号的端点检测 16-18 2.2.3 语音信号的特征提取 18-19 2.3 语音识别技术 19-21 2.3.1 特定人的语音识别技术 19-20 2.3.2 非特定人的语音识别技术 20-21 2.4 本章小结 21-22 第三章 基于DTW的特定人语音识别技术研究 22-30 3.1 DTW的关键问题 22 3.2 DTW算法分析 22-24 3.3 DTW算法的改进 24-26 3.4 实验设计与性能分析 26-29 3.4.1 实验设计 27-28 3.4.2 性能对比与分析 28-29 3.5 本章小结 29-30 第四章 基于HMM的非特定人语音识别技术研究 30-45 4.1 隐马尔可夫模型(HMM)简介 30-32 4.1.1 马尔可夫(Markov)链 30 4.1.2 HMM的基本思想和定义 30-32 4.1.3 HMM的分类 32 4.2 HMM的基本算法 32-35 4.3 模型参数的优化 35-36 4.4 实验设计与结果分析 36-44 4.4.1 实验工具 36-37 4.4.2 实验设计 37-42 4.4.3 结果分析 42-44 4.5 本章小结 44-45 第五章 语音识别技术在机器人控制中的应用 45-57 5.1 机器人硬件平台 45-49 5.1.1 机器人动作设计与调试 47-49 5.2 机器人和上位机之间的通讯 49-52 5.2.1 蓝牙通讯技术原理 49-50 5.2.2 蓝牙内嵌模块功能和设置 50-52 5.3 基于DTW的特定人的机器人语音控制的实现 52-54 5.3.1 软件开发平台 52 5.3.2 机器人特定人的语音控制实现 52-54 5.4 基于HMM的非特定人的机器人语音控制的实现 54-56 5.4.1 软件开发平台 54-55 5.4.2 机器人非特定人的语音控制实现 55-56 5.5 本章小结 56-57 第六章 结束语 57-59 论文总结 57 课题工作展望 57-59 参考文献 59-62 致谢 62-63 硕士期间发表的论文和参与的课题 63
|
相似论文
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 网络语音传输丢包的恢复技术,TN912.3
- 统计机器翻译中结构转换技术的研究,TP391.2
- 领域实体属性及事件抽取技术研究,TP391.1
- FPGA/DSP图像协处理技术及以太网数据传输,TP391.41
- 面向统计机器翻译的解码算法的研究,TP391.2
- PCB视觉检测系统中相机标定算法与位姿测定技术,TP391.41
- 基于ARM的实验机器人控制系统的研制,TP242.6
- 家庭清扫机器人路径覆盖系统的设计与实现,TP242
- 基于全局视觉的仿人机器人足球比赛系统,TP242.6
- 一种新型模块化自重构机器人的研究,TP242.2
- 基于粒子滤波的自主机器人视觉目标跟踪研究,TP242
- 下肢康复机器人的训练规划与康复效果评估,R49
- 基于机器视觉的光纤几何参数检测研究,TN253
- 仿人形机器手的开发与研究,TP242
- 面向用户的可重构模块化机器人分析与仿真研究,TP242
- 人类抗原肽载体结合力预测,R392.1
- 可重构模块化机器人构形综合与寻优,TP242
- 柑橘采摘机器人末端执行器研究,TP242
- 可重构式轮臂移动机器人的设计与仿真研究,TP242
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|