学位论文 > 优秀研究生学位论文题录展示
语音识别的环境噪音抑制研究
作 者: 梁建军
导 师: 汤荣江
学 校: 广东工业大学
专 业: 计算机应用技术
关键词: 语音识别 噪音抑制 端点检测 线性预测系数(LPC)距离
分类号: TN912.34
类 型: 硕士论文
年 份: 2007年
下 载: 172次
引 用: 1次
阅 读: 论文下载
内容摘要
本论文主要的研究内容是基于噪音环境下的语音识别性能的改进研究。语音识别是指利用计算机通过识别和理解把人类的语音信号转变为相应的文本或命令技术。然而,大多数语音识别系统都只适合于识别安静环境中的语音,当它们应用于噪音环境中时,性能却大大降低。因此,在噪音环境下进行语音识别是现阶段语音识别发展过程中的一个难点。虽然如此,但它在我们这种高速发展的信息时代却有着可观的实用价值。作者从语音识别的端点检测进行了研究,搭建了包括语音采集、噪音合成、特征提取,直到产生识别结果的在内的语音识别软件系统平台。在该平台的基础上,做了下面的改进研究:(1)提出一种端点检测的新算法:研究表明,即使在安静的环境中,语音识别系统一半以上的识别错误来自端点检测器。因此,作为语音识别系统的第一步,端点检测的重要性是不容忽视的,尤其是噪音环境下语音的端点检测,它的准确性很大程度上直接影响着后续的工作能否有效进行。所以,本文给出了一种基于线性预测系数(LPC)距离算法的端点检测方案,可以有效的解决强噪音环境下的端点检测问题。(2)基于新算法的改进:在强噪声情况下,LPC距离算法可以有效抑制噪音,可是它也有自己的不足之处,即不能在高信噪比的条件下进行有效的端点检测,而这恰恰是传统算法的长处,所以作者就考虑将两者结合起来,将两者的参数进行组合,实验证明,这种方法可以较大范围地满足噪音环境下的端点检测要求,进而可以更好地抑制环境噪音。
|
全文目录
摘要 4-5 ABSTRACT 5-6 目录 6-8 CONTENTS 8-10 第一章 绪论 10-19 1.1 语音识别的定义 10 1.2 语音识别的发展简介 10-12 1.3 语音识别技术的应用 12-14 1.3.1 语音信息检索 12 1.3.2 发音学习技术 12-13 1.3.3 基于语音的情感处理 13 1.3.4 网络环境下的语音识别 13-14 1.3.5 嵌入式语音识别技术 14 1.4 语音识别基本原理 14-15 1.5 语音识别系统的分类 15-17 1.5.1 按照词汇表大小分 15-16 1.5.2 按照发音方式分 16 1.5.3 按照说话人的限定范围分 16 1.5.4 按照识别方法分 16-17 1.6 语音识别面临的主要的问题 17-18 1.6.1 语音识别的方言和口音问题 17 1.6.2 信道问题 17 1.6.3 背景噪音问题 17 1.6.4 自然语音理解领域 17 1.6.5 语音合成 17-18 1.7 本论文要完成的内容 18-19 第二章 语音信号处理基本原理 19-45 2.1 语音信号产生的生理机制 19-24 2.1.1 语音信号产生及特征 19-22 2.1.2 人耳感知特性和噪音特性 22-23 2.1.3 语音信号产生的数学模型 23-24 2.2 语料库 24-26 2.2.1 语料库的概述 24-25 2.2.2 语音语料库的建立和收集要点 25-26 2.3 语音识别单元的选取 26-27 2.4 语音信号数字化及预处理 27-33 2.4.1 语音信号预滤波、语音采样、A/D变换 27-28 2.4.2 语音信号预处理 28-33 2.5 语音信号分析方法 33-43 2.5.1 时域处理方法 33-37 2.5.2 频域处理方法 37-40 2.5.3 同态处理及倒谱域特征提取方法 40-43 2.6 小结 43-45 第三章 语音识别的主要模型 45-54 3.1 概述 45 3.2 高斯混合模型 45-47 3.2.1 高斯混合模型的定义 45-46 3.2.2 高斯混合模型的迭代算法 46-47 3.3 隐马尔可夫模型(HMM) 47-53 3.3.1 隐马尔可夫模型的数学描述 47-48 3.3.2 隐马尔可夫模型的结构类型 48-50 3.3.3 HMM算法实现的问题 50-53 3.4 小结 53-54 第四章 噪音情况下的端点检测 54-65 4.1 端点检测原理 54-55 4.2 经典方法的比较 55-56 4.3 分析与改进设想 56-60 4.4 基于 LPC距离的综合研究方法 60-64 4.5 小结 64-65 第五章 系统仿真 65-68 5.1 强噪音环境下端点检测平台的建立 65-66 5.1.1 软件平台 65 5.1.2 语音库 65-66 5.2 实验结果及分析 66-67 5.3 展望 67 5.4 小结 67-68 结论 68-69 1.总结 68 2.展望 68-69 参考文献 69-72 攻读学位期间发表论文和获奖 72-74 致谢 74
|
相似论文
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 数字助听器中语音增强技术的研究,TN912.35
- 移动音视频交互业务执行平台的研究,TN915.09
- 功率谱估计在宽带ADCP信号检测中的研究与应用,TN911.23
- 基于电话信道的声纹识别算法研究,TN912.34
- 基于ARM9的语音控制智能终端的设计,TN912.3
- 基于嵌入式的特定人语音识别智能轮椅设计,TP368.12
- 呼叫中心IVR系统的设计与实现,TN99
- 基于ARM的语音识别研究,TN912.34
- 分布式语音识别技术在放射科信息系统中应用的研究,TN912.34
- Microsoft Agent技术在人脸表情识别系统中的应用,TP391.41
- 视频语义提取分析研究,TP391.41
- 基于矢量量化的音频信号辨析系统的研究,TN912.3
- 基于特征分类直方图均衡的鲁棒性语音识别研究,TN912.34
- 报告厅环境下语音增强方法研究,TN912.35
- 基于HLA飞行模拟指挥练习器的研究与设计,V216.8
- 语音识别后文本处理系统中文本语音信息评价算法研究,TN912.34
- 基于发音词典自适应的民族语口音汉语普通话语音识别,TN912.34
- 基于拼音编码的水下语音通信发射端的设计与实现,TN929.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|