学位论文 > 优秀研究生学位论文题录展示

基于车载嵌入式的语音端点检测算法研究

作 者: 刘其波
导 师: 李衍杰
学 校: 哈尔滨工业大学
专 业: 控制科学与工程
关键词: 车载电子设备 语音端点检测 耳蜗方程 顺序统计滤波 维纳滤波 线性判别函数
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 52次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着汽车产业的发展,人们对车载电子设备的需求越来越旺盛。语音识别技术经过近几年的发展,也逐渐走向实用,在车载电子设备中嵌入语音识别功能正成为车载电子产业的一个热点。语音信号的端点检测是智能车载语音识别设备必不可少的一个部分,语音端点检测算法的好坏直接影响到智能语音识别的准确率和识别速度,本文致力于研究基于车载语音识别设备的语音端点检测算法,提高语音识别的准确率和语音识别的速度,使车载设备使用起来更加方便和流畅。本文提出了一种基于耳蜗方程和子带信息融合的端点检测算法。该算法在采用维纳滤波法消噪的基础之上利用耳蜗方程来对语音信号的频谱进行非线性的子带划分。对于每一个子带,采用顺序统计滤波来估算该子带的信噪比,最后采用线性判别函数来融合每一个子带的信噪比信息,根据融合后的结果来进行语音端点检测。此外论文中还尝试了一种基于矩阵特征向量的端点检测算法,该算法将一维的语音信号转化为二维图像信号,采用图像处理的方法来做语音的端点检测,虽然因为计算量的问题没有被采用,但是算法中将一维信号变为二维信号进行处理的思想的提出具有积极的意义。基于863四大方言数据库和实际车载环境下的语音的实验验证了算法能够在车载环境噪声下保持较高的准确率,同时算法的复杂度也适合在车载嵌入式环境下使用。算法在车载设备上的成功实现明显提高了车载设备的语音识别的反应时间,同时识别的准确率也有一定程度的提高,为车载设备的实际应用提供了有力的保障。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-13
  1.1 课题研究背景及意义  8-9
  1.2 语音端点检测算法概述  9
  1.3 语音端点检测的研究现状  9-11
  1.4 论文的主要工作及内容安排  11-13
第2章 语音信号端点检测理论介绍  13-25
  2.1 语音信号的产生  13-16
    2.1.1 人类发声器官  13-14
    2.1.2 语音信号产生的数学模型  14-16
  2.2 人类听觉系统介绍  16
  2.3 语音信号的预处理和语音的基本特征  16-19
    2.3.1 语音信号的预处理  16-17
    2.3.2 语音信号的基本特征  17-19
  2.4 语音信号的消噪  19-21
    2.4.1 噪声一般特性  19-20
    2.4.2 车载噪声特性  20
    2.4.3 常见的消噪方法  20-21
  2.5 常见的端点检测算法  21-24
    2.5.1 基于短时能量和短时过零率的端点检测  21-22
    2.5.2 基于频率方差的端点检测算法  22-24
  2.6 小结  24-25
第3章 基于矩阵特征向量的端点检测算法  25-34
  3.1 算法原理介绍  25-26
  3.2 端点检测算法测评平台的搭建  26-28
  3.3 矩阵算法实验结果判断  28-33
  3.4 小结  33-34
第4章 基于耳蜗方程和子带信息融合的端点检测  34-52
  4.1 维纳滤波  34-35
  4.2 顺序统计滤波  35-36
  4.3 基于维纳滤波和子带顺序统计滤波的端点检测算法  36-40
  4.4 耳蜗方程  40-41
  4.5 线性判别函数  41-44
  4.6 基于耳蜗方程和子带信息融合的语音端点检测算法  44-47
  4.7 相关实验  47-51
    4.7.1 实验数据介绍  47-48
    4.7.2 子带划分数量确定实验  48-49
    4.7.3 VAD 效果实验  49-50
    4.7.4 VAD 对ASR 的影响  50-51
  4.8 小结  51-52
第5章 智能语音识别车载系统与算法移植  52-59
  5.1 智能车载系统项目背景  52
  5.2 车载系统架构  52-54
  5.3 端点检测算法移植  54-56
  5.4 车载系统端点检测判断策略  56-57
  5.5 基于车载设备的VAD 实验  57-58
    5.5.1 实验设置  57
    5.5.2 实验结果  57-58
  5.6 小结  58-59
结论与展望  59-61
参考文献  61-63
攻读学位期间发表的学术论文  63-65
致谢  65

相似论文

  1. 数字助听器中语音增强技术的研究,TN912.35
  2. 嵌入式处理器中多媒体加速单元的研究,TP332
  3. 医学超声图像斑点噪声去除的研究,TP391.41
  4. 运动模糊图像恢复算法的研究与实现,TP391.41
  5. 基于后向散射噪声模型的水下图像复原算法研究,TP391.41
  6. 常见模糊类型图像复原的研究与实现,TP391.41
  7. 流水线监控下的模糊图像处理,TP391.41
  8. 基于经验模态分解的语音端点检测算法研究,TN912.3
  9. 自适应光学图像复原算法研究,TP391.41
  10. 宽带信号快速DOA估计算法研究及其DSP实现,TN911.7
  11. 语音识别中的语音前端噪声处理,TN912.34
  12. 输电线路航拍图像处理及故障定位的研究,TM76;TM755
  13. 故障滚动轴承的转子系统基座振动响应特性分析,TH165.3
  14. 基于稳健性PLPC的抗噪语音识别方法的研究,TN912.34
  15. 图像成像过程中抖动补偿技术的研究,TP391.41
  16. 基于压缩视频的图像插值技术研究,TP391.41
  17. H.264可伸缩视频编码层间预测的研究,TN919.81
  18. 模糊图像复原方法研究,TP391.41
  19. 基于小波变换的汽车语音特征指令逼近与端点检测方法,TN912.3
  20. 噪声环境下说话人特征参数提取研究,TN912.3
  21. 基于小波域的磁共振及医学超声图像去噪研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com