学位论文 > 优秀研究生学位论文题录展示
机器手语音识别控制的研究与实现
作 者: 马宁
导 师: 郁道银
学 校: 天津大学
专 业: 光学工程
关键词: 动态时间规整 特定人 嵌入式系统 参考模版
分类号: TP242
类 型: 硕士论文
年 份: 2012年
下 载: 1次
引 用: 0次
阅 读: 论文下载
内容摘要
微创手术是目前十分普遍的外科手术形式,它将手术器械和内窥镜通过体表上的微创孔送入人体,对人体内腔器官实施手术,其关键技术之一是内窥镜的稳定定位和对焦。传统的人工手持方式虽然在操作灵活性方面具有优势,但人工操作难以长时间维持某一固定姿势,从而导致图像抖动和模糊,影响医生正常诊断和治疗。内窥镜自动定位装置解决了以上问题。但传统的操作模式会增加医生的负担,影响手术效率。本文在自动定位装置的基础上,提出了智能化的语音识别控制方式。医生通过语音口令控制内窥镜的移动和定位,操作方式上更加方便快捷。根据系统实际应用环境,完成了语音自动控制系统的整体方案设计,研究了基于动态时间规整(DTW)的语音识别算法,并提出了归一化平均动态时间规整算法(NA-DTW)。与传统算法相比,系统识别率和计算速度都得到了提高和改善。以片上Windows CE操作系统和ARM为软硬件平台,实现了基于嵌入式的机器手语音自动控制功能。论文主要工作:研究分析国内外常用的语音识别算法,对不同算法的性能进行总结,根据内窥镜自动定位系统对语音识别算法的要求,完成语音识别系统方案设计,选择基于动态时间规整(DTW)的语音识别算法作为核心算法;对语音识别算法流程中的预处理、端点检测、特征参数提取、模式识别等模块进行深入研究。针对传统DTW存在的缺点,提出了改进的归一化平均动态时间规整算法(NA-DTW),使算法在识别率和运算速度上都获得了较大改善;以片上Windows CE操作系统和ARM(S3C2440)为软硬件平台,实现算法的嵌入式移植。通过Embedded Visual C++(EVC++)编译软件完成语音识别控制中应用程序、控制程序和用户操作界面的C语音程序编写。完成语音识别模块的嵌入式软件开发;完成识别算法的MATLAB仿真实验,验证了NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469ms缩短到241ms。完成嵌入式系统整体功能验证,测试了语音识别系统中端点检测和语音识别的实际效果,验证系统在嵌入式硬件中运行的有效性和可靠性。
|
全文目录
摘要 3-4 ABSTRACT 4-6 目录 6-9 第一章 绪论 9-16 1.1 研究背景 10-12 1.1.1 内窥镜自动定位装置 10-11 1.1.2 语音识别技术 11-12 1.2 课题研究目的和意义 12-13 1.3 国内外研究现状 13-14 1.3.1 国外研究现状 13-14 1.3.2 国内研究现状 14 1.4 论文的主要内容 14-15 1.5 本章小结 15-16 第二章 语音识别系统的概述 16-25 2.1 语音信号处理的基础知识 16-19 2.1.1 语音的声学特征 16-17 2.1.2 语音信号的感知特性 17-18 2.1.3 语音信号的线性产生模型 18-19 2.2 语音识别的基本原理 19-21 2.2.1 端点检测 20 2.2.2 特征参数 20-21 2.3 常用的语音识别算法 21-23 2.3.1 矢量量化技术(VQ) 21-22 2.3.2 动态时间规整(DTW) 22 2.3.3 基于隐马尔可夫模型(HMM) 22-23 2.4 系统选用的语音识别算法 23-24 2.5 本章小结 24-25 第三章 NA-DTW 语音识别算法的研究 25-37 3.1 NA-DTW 的语音识别算法 25 3.2 预处理 25-28 3.2.1 语音采样 26 3.2.2 预加重 26 3.2.3 分帧加窗 26-28 3.3 端点检测 28-30 3.4 特征参数提取 30-31 3.5 动态时间规整(DTW)算法 31-34 3.6 归一化平均改进算法 34-36 3.7 本章小结 36-37 第四章 机器手语音识别的嵌入式实现 37-53 4.1 Windows CE 开发环境的简介 37-39 4.1.1 Windows CE 应用程序的开发流程 37-38 4.1.2 Embedded Visual C++ 编译环境的介绍 38-39 4.2 机器手语音识别控制系统的结构 39-40 4.3 机器手语音识别软件实现方案和设计流程 40-44 4.3.1 语音识别处理模块的实现方案 40-41 4.3.2 控制模块的设计流程 41-42 4.3.3 用户控制界面的设计流程 42-44 4.4 机器手语音识别软件开发过程 44-52 4.4.1 录音模块 44-48 4.4.2 识别模块 48-50 4.4.3 控制模块 50-52 4.5 本章小结 52-53 第五章 系统验证与结果分析 53-65 5.1 语音识别 MATLAB 仿真实验结果与分析 53-59 5.1.1 端点检测 MATLAB 仿真结果 53-55 5.1.2 DTW 算法仿真结果与分析 55-58 5.1.3 NA-DTW 算法性能仿真结果与分析 58-59 5.2 嵌入式系统验证 59-64 5.2.1 录音模块 60 5.2.2 端点检测 60-62 5.2.3 语音识别 62-63 5.2.4 控制实验 63-64 5.3 本章小结 64-65 第六章 总结与展望 65-67 6.1 工作总结 65-66 6.2 工作展望 66-67 参考文献 67-70 发表论文和参加科研情况说明 70-71 致谢 71
|
相似论文
- 汽车的电动助力转向系统,U463.4
- 基于ARM9的Windows CE系统移植,TP316.7
- 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
- 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
- 多线阵CCD视觉测量系统的数据采集与处理,TP274.2
- LXI-VXI适配器研制,TP274
- 高性能恒温晶体振荡器温度控制系统的研究,TN752
- 嵌入式中医经脉理疗仪的研究,R197.39
- 基于windows xp嵌入式系统的心电检测分析仪,R197.39
- 基于嵌入式系统钻孔成像装置的研究,P634.3
- 利用影响力受贿罪的司法认定,D924.392
- IPsec VPN嵌入式硬件防火墙加密卡的应用研究,TP393.08
- 基因表达时序数据聚类和比对分析方法研究,TP311.13
- 井下搜救机器人音视频采集传输研究与实现,TP274.2
- 四种菜籽饼粕在草鱼饲料中的应用研究,S963.314
- 基于WEB的GPS监控系统设计与实现,TP311.52
- 以太网MAC层协议研究与FPGA实现,TP393.04
- 基于CDMA2000的移动多媒体终端设计,TN929.5
- 基于SIP的手机视频监控系统的设计与实现,TN929.53
- 基于ARM9的鱼排养殖监控系统,TP368.1
- 基于PC104嵌入式车道控制器的研发,TP273.5
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 机器人技术 > 机器人
© 2012 www.xueweilunwen.com
|