学位论文 > 优秀研究生学位论文题录展示

机器手语音识别控制的研究与实现

作 者: 马宁
导 师: 郁道银
学 校: 天津大学
专 业: 光学工程
关键词: 动态时间规整 特定人 嵌入式系统 参考模版
分类号: TP242
类 型: 硕士论文
年 份: 2012年
下 载: 1次
引 用: 0次
阅 读: 论文下载
 

内容摘要


微创手术是目前十分普遍的外科手术形式,它将手术器械和内窥镜通过体表上的微创孔送入人体,对人体内腔器官实施手术,其关键技术之一是内窥镜的稳定定位和对焦。传统的人工手持方式虽然在操作灵活性方面具有优势,但人工操作难以长时间维持某一固定姿势,从而导致图像抖动和模糊,影响医生正常诊断和治疗。内窥镜自动定位装置解决了以上问题。但传统的操作模式会增加医生的负担,影响手术效率。本文在自动定位装置的基础上,提出了智能化的语音识别控制方式。医生通过语音口令控制内窥镜的移动和定位,操作方式上更加方便快捷。根据系统实际应用环境,完成了语音自动控制系统的整体方案设计,研究了基于动态时间规整(DTW)的语音识别算法,并提出了归一化平均动态时间规整算法(NA-DTW)。与传统算法相比,系统识别率和计算速度都得到了提高和改善。以片上Windows CE操作系统和ARM为软硬件平台,实现了基于嵌入式的机器手语音自动控制功能。论文主要工作:研究分析国内外常用的语音识别算法,对不同算法的性能进行总结,根据内窥镜自动定位系统对语音识别算法的要求,完成语音识别系统方案设计,选择基于动态时间规整(DTW)的语音识别算法作为核心算法;对语音识别算法流程中的预处理、端点检测、特征参数提取、模式识别等模块进行深入研究。针对传统DTW存在的缺点,提出了改进的归一化平均动态时间规整算法(NA-DTW),使算法在识别率和运算速度上都获得了较大改善;以片上Windows CE操作系统和ARM(S3C2440)为软硬件平台,实现算法的嵌入式移植。通过Embedded Visual C++(EVC++)编译软件完成语音识别控制中应用程序、控制程序和用户操作界面的C语音程序编写。完成语音识别模块的嵌入式软件开发;完成识别算法的MATLAB仿真实验,验证了NA-DTW算法与传统DTW算法相比,识别率从96.6%提高到99.76%,运算时间从469ms缩短到241ms。完成嵌入式系统整体功能验证,测试了语音识别系统中端点检测和语音识别的实际效果,验证系统在嵌入式硬件中运行的有效性和可靠性。

全文目录


摘要  3-4
ABSTRACT  4-6
目录  6-9
第一章 绪论  9-16
  1.1 研究背景  10-12
    1.1.1 内窥镜自动定位装置  10-11
    1.1.2 语音识别技术  11-12
  1.2 课题研究目的和意义  12-13
  1.3 国内外研究现状  13-14
    1.3.1 国外研究现状  13-14
    1.3.2 国内研究现状  14
  1.4 论文的主要内容  14-15
  1.5 本章小结  15-16
第二章 语音识别系统的概述  16-25
  2.1 语音信号处理的基础知识  16-19
    2.1.1 语音的声学特征  16-17
    2.1.2 语音信号的感知特性  17-18
    2.1.3 语音信号的线性产生模型  18-19
  2.2 语音识别的基本原理  19-21
    2.2.1 端点检测  20
    2.2.2 特征参数  20-21
  2.3 常用的语音识别算法  21-23
    2.3.1 矢量量化技术(VQ)  21-22
    2.3.2 动态时间规整(DTW)  22
    2.3.3 基于隐马尔可夫模型(HMM)  22-23
  2.4 系统选用的语音识别算法  23-24
  2.5 本章小结  24-25
第三章 NA-DTW 语音识别算法的研究  25-37
  3.1 NA-DTW 的语音识别算法  25
  3.2 预处理  25-28
    3.2.1 语音采样  26
    3.2.2 预加重  26
    3.2.3 分帧加窗  26-28
  3.3 端点检测  28-30
  3.4 特征参数提取  30-31
  3.5 动态时间规整(DTW)算法  31-34
  3.6 归一化平均改进算法  34-36
  3.7 本章小结  36-37
第四章 机器手语音识别的嵌入式实现  37-53
  4.1 Windows CE 开发环境的简介  37-39
    4.1.1 Windows CE 应用程序的开发流程  37-38
    4.1.2 Embedded Visual C++ 编译环境的介绍  38-39
  4.2 机器手语音识别控制系统的结构  39-40
  4.3 机器手语音识别软件实现方案和设计流程  40-44
    4.3.1 语音识别处理模块的实现方案  40-41
    4.3.2 控制模块的设计流程  41-42
    4.3.3 用户控制界面的设计流程  42-44
  4.4 机器手语音识别软件开发过程  44-52
    4.4.1 录音模块  44-48
    4.4.2 识别模块  48-50
    4.4.3 控制模块  50-52
  4.5 本章小结  52-53
第五章 系统验证与结果分析  53-65
  5.1 语音识别 MATLAB 仿真实验结果与分析  53-59
    5.1.1 端点检测 MATLAB 仿真结果  53-55
    5.1.2 DTW 算法仿真结果与分析  55-58
    5.1.3 NA-DTW 算法性能仿真结果与分析  58-59
  5.2 嵌入式系统验证  59-64
    5.2.1 录音模块  60
    5.2.2 端点检测  60-62
    5.2.3 语音识别  62-63
    5.2.4 控制实验  63-64
  5.3 本章小结  64-65
第六章 总结与展望  65-67
  6.1 工作总结  65-66
  6.2 工作展望  66-67
参考文献  67-70
发表论文和参加科研情况说明  70-71
致谢  71

相似论文

  1. 汽车的电动助力转向系统,U463.4
  2. 基于ARM9的Windows CE系统移植,TP316.7
  3. 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
  4. 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
  5. 多线阵CCD视觉测量系统的数据采集与处理,TP274.2
  6. LXI-VXI适配器研制,TP274
  7. 高性能恒温晶体振荡器温度控制系统的研究,TN752
  8. 嵌入式中医经脉理疗仪的研究,R197.39
  9. 基于windows xp嵌入式系统的心电检测分析仪,R197.39
  10. 基于嵌入式系统钻孔成像装置的研究,P634.3
  11. 利用影响力受贿罪的司法认定,D924.392
  12. IPsec VPN嵌入式硬件防火墙加密卡的应用研究,TP393.08
  13. 基因表达时序数据聚类和比对分析方法研究,TP311.13
  14. 井下搜救机器人音视频采集传输研究与实现,TP274.2
  15. 四种菜籽饼粕在草鱼饲料中的应用研究,S963.314
  16. 基于WEB的GPS监控系统设计与实现,TP311.52
  17. 以太网MAC层协议研究与FPGA实现,TP393.04
  18. 基于CDMA2000的移动多媒体终端设计,TN929.5
  19. 基于SIP的手机视频监控系统的设计与实现,TN929.53
  20. 基于ARM9的鱼排养殖监控系统,TP368.1
  21. 基于PC104嵌入式车道控制器的研发,TP273.5

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 机器人技术 > 机器人
© 2012 www.xueweilunwen.com