学位论文 > 优秀研究生学位论文题录展示

基于听觉感知特性短时谱估计的改进语音增强算法

作 者: 王海艳
导 师: 赵晓晖
学 校: 吉林大学
专 业: 信号与信息处理
关键词: 语音增强 短时谱估计 感知特性 语音分割 MMSE 掩蔽效应
分类号: TN912.3
类 型: 硕士论文
年 份: 2007年
下 载: 185次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文研究了一种基于听觉感知准则谱幅度预测的语音增强算法,该算法利用了已经用于语音识别的失真度量准则,该准则考虑了人类听觉系统掩蔽效应,减少了对信号谱峰的处理,也就减少了对语音信号波形的失真,从而提高了基于短时谱预测的语音增强算法的信噪比和语音质量。由于信噪比的估计目前多数语音增强算法一个关键问题,本文还研究了一种改进两步法信噪比估计算法,该算法利用了直接信噪比估计算法的实验特性,用下一帧新信噪比估计作为当前帧的信噪比估计,这种方法既能够继承直接法的优点,又有效的克服了直接法所存在的时延问题。最后本文给出了一种语音自适应分帧算法,这种算法主要利用的是信号的统计特性,对语音信号进行自适应分段,若相邻的两个平稳的语音段具有相同的分布即视这两段信号为一平稳的语音短,将分割好的语音段用来估计带噪语音谱分量,这种方法,能够减少语音增强处理在语音过渡带所引起的失真。

全文目录


提要  4-7
第一章 绪论  7-12
  1.1 引言  7
  1.2 语音增强算法的基本问题  7-11
    1.2.1 线性预测  8
    1.2.2 幅度谱预测  8-9
    1.2.3 高斯模型假设  9-11
    1.2.4 信号存在与否的不确定性  11
  1.3 本文研究内容  11-12
第二章 单通道语音增强算法概述  12-24
  2.1 利用语音信号或噪声信号的周期性衰减噪声  12-14
    2.1.1 梳状滤波器  12
    2.1.2 自适应噪声对消方法(ANC)  12-14
  2.2 基于语音生成模型的语音增强算法  14-17
    2.2.1 基于LPC 全极点模型的增强算法  14-15
    2.2.2 最大后验概率法  15
    2.2.3 卡尔曼滤波法  15-17
  2.3 基于短时谱幅度预测的语音增强算法  17-22
    2.3.1 短时谱估计  17-18
    2.3.2 谱减法  18-21
    2.3.3 短时谱幅度的MMSE 估计方法  21-22
  2.4 基于听觉感知准则的语音增强算法  22-24
第三章 基于听觉感知准则谱幅度贝叶斯估计的语音增强算法  24-31
  3.1 贝叶斯估计的一般形式  24-25
    3.1.1 问题的引入  24-25
    3.1.2 风险函数  25
  3.2 基于听觉感知准则的语音短时谱幅度预测  25-31
    3.2.1 考虑听觉掩蔽效应因素的语音增强算法  26-27
    3.2.2 考虑听觉掩蔽效应因素的语音增强算法的一般情况  27-31
第四章 改进的信噪比估计算法  31-40
  4.1 噪声消除参数及规则  31-34
  4.2 信噪比直接估计法  34-37
    4.2.1 直接法估计法原理  34-35
    4.2.2 分析  35-37
  4.3 两步噪声消除技术  37-40
    4.3.1 两步估计法原理  37-39
    4.3.2 性能分析与比较  39-40
第五章 自适应语音分割技术  40-47
  5.1 语音分割  40-41
  5.2 自适应语音分割  41-47
    5.2.1 问题提出的必要性  41-42
    5.2.2 算法的推导  42-46
    5.2.3 算法的实现  46-47
第六章 仿真分析与总结  47-50
  6.1 仿真分析  47-49
  6.2 总结  49-50
参考文献  50-54
摘要  54-56
ABSTRACT  56-59
致谢  59-60
导师及作者简介  60

相似论文

  1. 较低水平控制性降压对脊柱手术病人术后认知功能的影响,R614
  2. 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
  3. 视觉事件相关电位P300在老年抑郁症临床特征评定中的作用,R749.41
  4. 数字助听器中语音增强技术的研究,TN912.35
  5. 单通道语音增强算法的研究,TN912.35
  6. 多管阵列定向语音增强系统的研制,TN912.35
  7. 基于听觉侧抑制的滤波算法研究,TN911.72
  8. 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
  9. 基于人耳掩蔽效应的谱减算法的研究与实现,TN912.3
  10. 复杂环境下语音增强方法研究,TN912.35
  11. 基于导频的MIMO-OFDM系统信道估计技术研究,TN919.3
  12. P300和MoCA量表在诊断脑梗死后认知障碍中的价值,R743.3
  13. 电针头穴与电针头穴加辩证配穴治疗轻度认知障碍的临床疗效评价,R246.6
  14. 头电针“通督调髓”法治疗轻度认知功能障碍的临床随机对照研究,R246.6
  15. LTE上行链路均衡的研究与实现,TN929.5
  16. MELPe语音编码关键技术研究,TN912.3
  17. 基于子空间的语音增强算法研究,TN912.35
  18. 低信噪比下的语音增强方法研究,TN912.35
  19. 基于DM6446嵌入式平台的语音增强算法实现与优化,TN912.35
  20. 基于ARM的嵌入式语音识别的研究,TN912.34
  21. 基于DFT的OFDM系统的MMSE信道估计研究,TN919.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com