学位论文 > 优秀研究生学位论文题录展示

基于相空间重构的语音增强研究

作 者: 许春卿
导 师: 郭继昌
学 校: 天津大学
专 业: 电路与系统
关键词: 语音增强 相空间重构 相空间降噪
分类号: TN912.35
类 型: 硕士论文
年 份: 2007年
下 载: 107次
引 用: 1次
阅 读: 论文下载
 

内容摘要


语音信号在处理、传送的过程中不可避免地会受到噪声的干扰。今天,人们对语音质量有着更高的要求。语音增强就是研究如何尽量减少被噪声污染的语音信号中的噪声成分,并尽量减小语音信号的失真度,增加其可懂度和舒适度。混沌学是研究系统演化过程及其内在规律的科学,它揭示了看起来无规则运动背后的规律性,为研究复杂的自然现象提供了新的途径。混沌理论广泛应用于自然科学和社会科学的众多领域。混沌时间序列分析的基础是相空间重构理论。相空间重构把单变量时间序列扩展到多维空间中来,从而可以把相空间研究的各种方法应用到时间序列当中,揭示出时间序列演化过程中隐含的规律性。本文在相空间重构理论的基础上分析了汉语的混沌学特征,编写程序计算了包括相关维、最大Lyapunov指数等参数。可以看到汉语语音中蕴涵着丰富的混沌学信息,是介于周期性确定信号和随机性不确定信号之间的一种信号。相关维是刻画混沌信号吸引子结构的重要指标,语音信号与随机噪声的相关维有较大的差别,这就为语音增强中区分这两种分量提供了理论依据。本文将相空间降噪方法应用于语音增强之中。将含噪语音信号进行相空间重构,由于语音信号集中在有限空间,而随机噪声则分散在各个分量中,通过找到信号能量集中的信号空间,去除噪声能量集中的冗余空间,达到减少噪声的目的。在程序的编写中,本文改进了基本算法中邻点的选取方法,减少了计算量。在实验中,本文先对汉语单个音素进行了相空间语音增强,主要使用客观评价方法分析增强前后的信噪比以及不同类音素增强效果的差异;然后从客观和主观两方面评价对连续语音的相空间增强效果。从实验结果来看,相空间语音增强不论从提高信噪比来说还是从减少语音失真来说,都得到了比较令人满意的结果。

全文目录


摘要  3-4
ABSTRACT  4-7
第一章 绪论  7-10
  1.1 语音增强的意义  7
  1.2 语音增强的历史和现状  7-8
  1.3 语音增强的应用  8-9
  1.4 本论文的内容和方法  9-10
第二章 语音增强相关知识  10-21
  2.1 语音信号的特点  10-13
    2.1.1 语音的声学特点  10-11
    2.1.2 语音产生的数字模型  11-13
    2.1.3 人耳的听觉特性  13
  2.2 语音信号的时域分析  13-15
    2.2.1 短时能量和平均幅度  14-15
    2.2.2 短时平均过零率  15
  2.3 语音增强概述  15-20
    2.3.1 语音增强的研究内容  15-16
    2.3.2 语音和噪声特性分析  16-18
    2.3.3 语音增强算法分类  18-20
  2.4 本章小结  20-21
第三章 混沌时间序列分析  21-32
  3.1 混沌相关理论  21-26
    3.1.1 概述  21-22
    3.1.2 混沌时间序列  22-23
    3.1.3 混沌特性识别方法  23-24
    3.1.4 分数维数  24-25
    3.1.5 Lyapunov 指数  25-26
  3.2 相空间重构  26-30
    3.2.1 相空间重构及Takens 定理  26-27
    3.2.2 相关维和嵌入延迟的计算方法  27-30
  3.3 相空间降噪方法  30-31
  3.4 本章小结  31-32
第四章 汉语的混沌特征分析  32-43
  4.1 汉语的特点  32-33
  4.2 汉语音素的Lyapunov 指数分析  33-35
  4.3 汉语音素的最佳延迟分析  35-38
  4.4 汉语音素的相关维分析  38-41
  4.5 本章小结  41-43
第五章 相空间语音增强  43-59
  5.1 相空间中信号的降噪  43-44
  5.2 相空间降噪算法  44-50
    5.2.1 基本算法  44-48
    5.2.2 算法的改进  48-50
  5.3 语音增强的评价方法  50-52
    5.3.1 主观评价  50-51
    5.3.2 客观评价  51-52
  5.4 对音素的增强实验  52-56
    5.4.1 元音  52-53
    5.4.2 浊辅音  53-55
    5.4.3 清辅音  55-56
  5.5 对连续语音的增强实验  56-58
  5.6 本章小结  58-59
第六章 总结与展望  59-61
参考文献  61-64
发表论文和参加科研情况说明  64-65
附录  65-68
致谢  68

相似论文

  1. 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
  2. 数字助听器中语音增强技术的研究,TN912.35
  3. 基于FFT的混沌短期负荷预测方法的改进研究,TM715
  4. 多管阵列定向语音增强系统的研制,TN912.35
  5. 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
  6. 复杂环境下语音增强方法研究,TN912.35
  7. 人民币汇率时间序列的异常数据挖掘研究,F832.52
  8. 麦克风阵列语音增强技术研究,TN912.35
  9. 数字基带语音增强算法的研究及SDR实现,TN912.35
  10. 基于GMDH方法的设备剩余寿命预测,F273;F426.4
  11. 跳频信号预测与混沌同步的研究,TN914.41
  12. 基于LMS算法的语音增强系统的研究,TN912.35
  13. 基于混沌动力学的黄金价格时序研究,F831.54
  14. 基于COPULA方法提取非线性时间序列的趋势项,F831.51
  15. 双通道语音增强系统设计与实现,TN912.35
  16. 基于混沌和PSO神经网络的短时交通流预测研究,U491.112
  17. 基于混沌神经网络的电力负荷短期预测,TM715
  18. 基于模糊小波神经网络的短波通信频率预测方法研究,TN925
  19. 贝叶斯神经网络在股票预测中的应用,F224
  20. 基于小波变换的语音增强及DSP实现,TN912.35
  21. MELPe语音编码关键技术研究,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com