学位论文 > 优秀研究生学位论文题录展示
基于谱估计统计模型的语音增强算法研究
作 者: 卢志强
导 师: 赵欢
学 校: 湖南大学
专 业: 信息与通信工程
关键词: 语音增强 统计模型 增益函数 最小均方误差 贝叶斯估计 代价函数
分类号: TN912.35
类 型: 硕士论文
年 份: 2013年
下 载: 3次
引 用: 0次
阅 读: 论文下载
内容摘要
在实际环境中,语音信号不可避免的会受到周围噪声环境的干扰,尽可能从带噪语音信号中恢复原始语音信号,提高语音质量和改善语音可懂度是语音增强的主要目的。语音增强方法种类很多,基于谱估计统计模型语音增强方法由于具有方法简单且易于理解、适用信噪比范围大以及适用噪声环境广等优点成为应用最广泛的语音增强技术之一。本文就基于谱估计高斯模型语音增强技术展开研究,提出了两种新的语音增强方法:鉴于短时能量谱最小均方误差估计器(MMSE-SP)与幅度平方谱最小均方误差估计器(MMSE-MSS)具有不同的表现效果,在低先验信噪比和高后验信噪比情况下,MMSE-SP的增强效果不及MMSE-MSS,而在高先验信噪比和低后验信噪比情况下,前者在不减少语音失真条件下能更有效消除背景噪声。本文结合两者的优点提出一种改进的增益函数,同时,由于带噪语音模型中语音存在不确定性,本文估计出每个频点的无语音概率(SAP)对新的增益函数又做了进一步改进,大量实结果表明,新算法能够更有效抑制背景噪声,改善语音清晰度。基于贝叶斯估计的语音增强方法中,最小化贝叶斯风险函数是常用的处理方式。由于不同的代价函数利用贝叶斯估计可以产生不同的增益函数,许多相应的代价函数相继被提出,而绝对值误差代价函数却并未受到关注。本文立足于幅度平方谱最小均方误差估计(MMSE-MSS)方法提出一种新型的幅度平方谱条件中位数(CM-MSS)语音增估计方法,该方法与MMSE-MSS方法相比,获得了更好的语音可懂度和可感知性。
|
全文目录
摘要 5-6 Abstract 6-10 插图索引 10-11 附表索引 11-12 第1章 绪论 12-16 1.1 课题研究背景及意义 12-13 1.2 语音增强研究现状 13-14 1.3 本文主要研究内容及安排 14-16 第2章 语音增强相关问题 16-25 2.1 语音增强相关特性 16-18 2.1.1 语音信号特性 16-17 2.1.2 噪声信号特性及分类 17 2.1.3 人耳感知特性 17-18 2.2 语音增强信号模型 18-19 2.3 信噪比估计 19-20 2.4 语音增强评估标准 20-24 2.4.1 主观评价方法 20-21 2.4.2 客观评价方法 21-24 2.5 实验语料库 24 2.6 小结 24-25 第3章 语音增强方法概述 25-35 3.1 统计模型 25-26 3.1.1 高斯模型和超高斯模型 25-26 3.1.2 不确定性模型 26 3.2 估计方法 26-28 3.2.1 最小均方误差 26-27 3.2.2 最大似然估计 27 3.2.3 最大后验概率估计 27-28 3.3 基于统计模型的语音增强算法 28-34 3.3.1 谱减法 28-30 3.3.2 维纳滤波法 30-31 3.3.3 最小均方误差法 31-34 3.4 小结 34-35 第4章 改进增益函数的语音增强算法 35-47 4.1 基本算法 35-37 4.1.1 短时能量谱最小均方估计器(MMSE-SP) 35-36 4.1.2 幅度平方谱最小均方估计器(MMSE-MSS) 36-37 4.2 改进算法 37-41 4.2.1 改进算法流程图 37-38 4.2.2 算法推导 38-40 4.2.3 先验无音概率估计 40-41 4.3 算法实现及仿真 41-46 4.3.1 实验平台及参数 41 4.3.2 实验结果分析 41-46 4.4 小结 46-47 第5章 条件中位数语音增强算法 47-58 5.1 贝叶斯统计 47-50 5.1.1 贝叶斯统计概述 47 5.1.2 贝叶斯估计器 47-50 5.2 基于幅度平方谱的语音增强算法 50-53 5.2.1 幅度平方谱最小均方误差估计器 51 5.2.2 幅度平方谱条件中位数估计器 51-53 5.3 实验结果及仿真 53-57 5.3.1 实验平台及参数 53 5.3.2 实验结果分析 53-57 5.4 小结 57-58 结论 58-60 参考文献 60-66 致谢 66-67 附录 A 攻读硕士学位期间发表的学术论文及参与的科研项目 67
|
相似论文
- 基于二值掩蔽和感知小波包变换的语音增强研究,TN912.35
- 基于项目反应模型的试卷质量分析及学生能力评估,G449
- 多元一维项目反应理论模型及应用,O212
- 几何分布参数的经验贝叶斯估计及其优良性,O212.8
- 带控制时滞的非线性随机系统的最优控制设计,O232
- 大规模水的动画和实时渲染技术,TP391.41
- 马尔科夫协整转换模型的研究,F224
- 大坝安全监测系统设计及数据分析,TV698.1
- MIMO系统中基于LDPC编码的迭代检测算法研究,TN919.3
- 数字助听器中语音增强技术的研究,TN912.35
- 基于双目立体视觉的水下三维重建,TP391.41
- 基于数字高程模型栅格地图的移动机器人路径规划研究,TP242
- OFDM认知无线电中的自适应资源分配算法研究,TN925
- 球麦克风阵列波束形成语音增强方法的研究,TN912.35
- CMAC神经网络的模型改进及在油藏工程中的应用,TP183
- 面向视觉传感器网络的目标定位与追踪研究,TP391.41
- 单通道语音增强算法的研究,TN912.35
- 针对链接语料的主题社区挖掘,TP391.1
- 多管阵列定向语音增强系统的研制,TN912.35
- 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
- 复杂环境下语音增强方法研究,TN912.35
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com
|