学位论文 > 优秀研究生学位论文题录展示

基于BP神经网络的语音增强研究

作 者: 周元芬
导 师: 刘宇红
学 校: 贵州大学
专 业: 电路与系统
关键词: 神经网络 MEL倒谱系数 语音增强 量化共轭梯度法
分类号: TN912.35
类 型: 硕士论文
年 份: 2009年
下 载: 55次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音是人类相互之间交流信息最快捷、最重要、最有效和最方便的形式。然而在实际环境下的语音应用过程中,例如语音通信、语音编码、语音识别、语音合成等,不可避免的受到来自周围环境的各种噪声影响。噪声不但降低了语音质量和可懂度,而且还将导致系统性能的急剧恶化。而语音增强的目的则是从带噪语音中提取尽可能纯净的原始语音信号,目标是改进语音质量,提高语音可懂度。因此,语音增强是语音信号处理的重要分支,也是语音识别,语音编码等语音信号处理的重要预处理环节。人工神经网络是大脑神经网络的理论化数学模型,是对生物神经网络进行某种抽象、简化和模拟,反映了人脑的许多基本特性,具有大规模并行、分布式存储和处理、自组织、自适应和自学习能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题,能够进行复杂的逻辑操作和非线性关系的实现。利用神经网络来设计语音增强系统具有重要的理论意义和使用价值。本文基于语音增强的两个目标,通过设计一个BP神经网络滤波器来压制语音信号中的噪声,探索研究语音信号去噪处理的新方法、新技术。第一,本文主要讨论了基于BP神经网络的语音增强方法。首先从语音、人耳语音感知和噪声的特性入手,分别介绍了语音信号和神经网络的基本理论,然后提出了基于BP神经网络的语音增强系统和BP神经网络的建模方法。阐述语音信号的特征提取过程并利用时间规整网络对语音特征参数进行重新分段处理,归纳了语音倒谱参数用于神经网络的训练和学习并最终消除噪声的过程。仿真结果表明,基于BP神经网络的语音增强系统的设计方法,实现过程简单,语音增强效果良好,能够证明用BP神经网络进行语音去噪处理的可行性。第二,本文利用BP神经网络进行语音增强,分别在无噪和含噪条件下,提取语音信号的Mel倒谱系数,用于BP神经网络的训练和学习,利用神经网络系统具有非线性映射和自学习能力,能够实现语音信号的非线性建模的能力,获取语音信号的最佳估计,克服语音信号处理中存在的不确定性,最终达到语音信号消噪和提高可懂度的目的。

全文目录


摘要  5-6
Abstract  6-8
第一章 绪言  8-19
  1.1 引言  8-9
  1.2 语音增强的意义与研究现状  9-12
    1.2.1 语音增强的目的  9
    1.2.2 语音增强的意义  9-11
    1.2.3 国内外语音增强研究现状  11
    1.2.4 语音增强的算法概述  11-12
  1.3 神经网络的研究现状及发展趋势  12-17
    1.3.1 神经网络的概念和特征  12-13
    1.3.2 人工神经网络的发展  13-14
    1.3.3 神经网络的优越性及应用  14-16
    1.3.4 神经网络的未来发展方向  16-17
  1.4 论文的安排  17-19
第二章 语音信号的特征提取  19-32
  2.1 语音信号生成的数学模型  19-20
  2.2 语音信号的特性  20-21
  2.3 人耳感知特性  21
  2.4 噪声特性  21-23
  2.5 语音端点检测算法概述  23-24
  2.6 双门限语音端点检测方法  24-26
  2.7 语音信号的特征提取  26
  2.8 MEL倒谱系数提取  26-32
    2.8.1 MEL倒谱系数  27-28
    2.8.2 Mel倒谱参数的提取过程  28-30
    2.8.3 MEL倒谱参数的计算步骤  30-32
第三章 神经网络的基本原理  32-45
  3.1 神经网络简介  32
  3.2 人工神经元模型  32-36
  3.3 神经网络结构及工作方式  36-38
  3.4 BP神经网络  38-40
  3.5 BP神经网络的学习算法  40-45
    3.5.1 学习样本的收集  41
    3.5.2 学习样本的整理  41-42
    3.5.3 量化共轭梯度BP算法  42-45
第四章 系统设计研究  45-59
  4.1 信噪比的计算方法  45
  4.2 基于BP神经网络的语音增强系统  45-47
  4.3 去噪BP神经网络的构建  47-48
  4.4 语音信号的预处理  48-50
  4.5 基于神经网络含噪语音的特征提取  50-51
  4.6 时间规整网络的结构原理和算法  51-52
  4.7 仿真  52-59
第五章 回顾及展望  59-61
参考文献  61-64
致谢  64-65
附录:发表论文  65-66

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
  4. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  5. 红外超光谱图像的虚拟探测器研究,TP391.41
  6. 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
  7. 基于神经网络的水厂投药预测控制研究,TP273.1
  8. 视觉伺服四自由度机械臂的研究,TP242.6
  9. 机械臂视觉伺服系统的研究,TP242.6
  10. 压电驱动微工作台的控制与校正技术研究,TP273
  11. 某武器检测装置的控制系统设计,TP183
  12. 市级旅游用地规划环境影响评价研究,X820.3
  13. 珠三角地区高性能混凝土配合比智能化系统,TU528
  14. 大学生综合素质测评研究,G645.5
  15. 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
  16. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  17. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  18. 基于神经网络辨识的同步发电机励磁控制研究,TM31
  19. 基于BP神经网络的水稻干燥智能控制研究,S226.6
  20. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  21. 海上平台消防系统研究,U698.4

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com