学位论文 > 优秀研究生学位论文题录展示
噪声环境下语音特征参数提取与匹配算法的研究
作 者: 韩卫生
导 师: 刘伟
学 校: 河南科技大学
专 业: 控制理论与控制工程
关键词: 语音识别 语音增强 特征提取 动态时间归正 隐马尔可夫模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 100次
引 用: 0次
阅 读: 论文下载
内容摘要
语音识别是语音信号处理的一个重要研究方向,它的目的是实现人与机器之间的无障碍沟通。当前的语音识别系统在试验条件下通常都能取得优良的效果,但在将其应用到实际中时性能会骤然下降。本论文以提高语音识别系统性能为研究重点,对噪声环境下语音识别技术的关键技术作了深入探讨。论文首先介绍了语音识别的基本概况、对课题研究意义进行了说明,并对语音识别原理进行了分析;针对噪声环境中语音识别率较低的状况,论文对语音增强算法进行研究,分析了几种常用的语音增强算法:谱减法、自适应抵消法、小波阈值法等,并提出一种基于Hilbert-Huang变换的语音增强方法,该方法根据经验模态分解得到不同基函数分量,自适应调节门限阈值实现去噪,通过仿真试验说明该方法的优点。接下来,论文分析了特征参数提取算法,总结分析了当前比较流行的几种特征参数提取算法,对线性预测系数、感知线性倒谱系数及Mel频率倒谱系数的原理、实现流程作了详细介绍,通过试验比较这几种系数的优劣。最后论文对语音识别中的匹配算法进行研究,介绍了三种匹配算法:矢量量化法、动态时间归正技术及隐马尔可夫模型。前两种技术在孤立词、小词汇量语音识别系统中都取得良好效果,但在大词汇量连续语音识别系统中隐马尔科夫模型更具优势。针对大词汇量语音识别计算负担过重的问题,将Viterbi算法与Beam剪枝技术相结合,在识别率基本不受影响的情况下,大大压缩了搜索空间,减小计算负担,并提出一种优化剪枝门限方法,通过试验证明该方法的可行性。
|
全文目录
摘要 2-3 ABSTRACT 3-5 符号表 5-8 第1章 绪论 8-14 1.1 语音识别技术应用研究 8-9 1.2 语音识别技术发展史及国内外研究现状 9-11 1.3 语音识别系统分类 11-12 1.4 课题研究意义及内容 12-14 第2章 语音识别原理 14-25 2.1 语音信号产生模型 14-15 2.2 语音增强 15-16 2.3 语音信号预处理 16-18 2.3.1 语音信号采样 16-17 2.3.2 语音信号预加重 17 2.3.3 语音信号加窗 17-18 2.4 端点检测 18-24 2.4.1 短时能量 18-20 2.4.2 短时平均过零率 20-22 2.4.3 “能零法”端点检测 22-24 2.5 本章小结 24-25 第3章 语音增强技术 25-38 3.1 谱减法 25-26 3.2 自适应滤波法 26-28 3.3 基于小波阈值增强算法 28-29 3.4 基于Hilbert-Huang 变换的语音增强 29-32 3.4.1 算法介绍 29-31 3.4.2 基于HHT 的语音增强方法 31-32 3.5 试验分析 32-37 3.5.1 atan-LMS 有效性分析 32-33 3.5.2 基于HHT 的语音增强 33-36 3.5.3 不同方法增强效果对比 36-37 3.6 本章小结 37-38 第4章 语音信号特征参数提取 38-50 4.1 线性预测系数 38-42 4.1.1 线性预测的基本原理 38-41 4.1.2 线性预测方程解法 41-42 4.2 LPC 倒谱系数 42-43 4.3 感知线性预测分析 43-45 4.4 Mel 倒谱系数 45-48 4.5 试验分析 48-49 4.6 本章小结 49-50 第5章 语音匹配算法研究 50-68 5.1 矢量量化方法 50-52 5.1.1 无记忆矢量量化 50-51 5.1.2 有记忆矢量量化 51-52 5.2 动态时间归正算法 52-56 5.2.1 算法介绍 52-55 5.2.2 试验分析 55-56 5.3 基于隐马尔科夫模型的语音匹配算法研究 56-67 5.3.1 HMM 基本思想 57-60 5.3.2 基于HMM 语音匹配算法 60-65 5.3.3 基于HMM 语音匹配算法试验分析 65-67 5.4 本章小结 67-68 第6章 结论 68-70 6.1 课题总结 68-69 6.2 工作展望 69-70 缩略语词汇表 70-71 参考文献 71-74 致谢 74-75 攻读硕士学位期间的研究成果 75
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|