学位论文 > 优秀研究生学位论文题录展示

低信噪比下语音频率参数估计

作 者: 刘何来
导 师: 张正炳; 杨顺辽; 杨亚林
学 校: 长江大学
专 业: 电子与通信工程
关键词: 基音频率 共振峰频率 线性预测分析 信噪比
分类号: TN912.3
类 型: 硕士论文
年 份: 2013年
下 载: 46次
引 用: 0次
阅 读: 论文下载
 

内容摘要


信噪比下语音频率参数估计一直是语音信号处理的一个很重要的研究方向,尤其是基频参数及共振峰参数对语音识别、语音合成及语音的压缩编码等,都具有很重要的理论和实际意义。本文从研究语音信号处理的一些基础性理论入手,着重研究了语音信号的产生模型与线性预测分析,抗噪理论与方法,分析了在低信噪比下提高线性预测估计的方法,改进了在低信噪比下提取语音基频和共振峰频率的方法,并在语音信号的预处理和后处理上做了一定的改进。通过在Matlab平台上进行仿真实验表明,新的方法能得到较小的线性预测误差,提高线性预测的准确性。本文的主要研究工作如下:首先,本文简要分析了语音信号的产生及特点、语音信号产生模型及线性预测分析理论、预加重和分帧等预处理及其端点检测的常用方法分析等。考虑为提高求取的线性预测系数的准确性,线性预测分析的方法采用协方差格型法,并对其原理进行较详细的分析。另外,利用清音和浊音信号在过零率上概率分布的差异,结合自相关函数法检测浊音信号良好的性能,提出了一种适合低信噪比下浊音端点检测方法,并在Matlab平台上进行了实验,效果较好。其次,分析语音信号基音频率和共振峰频率检测的常用方法。就基频检测,分析比较了自相关函数法、平均幅度差函数法、倒谱法及简易逆滤波法。在低信噪比下,自相关函数法易出现倍频或半频现象,检测效果较差,倒谱法和平均幅度差函数法性能下降严重,简易逆滤波法较其他三种方法性能要好。对于共振峰频率检测的常用方法,短时傅里叶变换法受噪声影响较大,低信噪比下对于共振峰估计误差较大;倒谱法可以很好地实现声道与激励的分离,但一般所得到的倒谱包络点数较少,精度不高,且倒谱法本身运算量较大,受噪声的影响严重,不适合低信噪比下进行检测;线性预测法相比其他两种方法效果,较为实用。接着,分析讨论了噪声对信号的影响,以及减少噪声的原理和方法。考虑到线性预测(LPC)阶数的选取对线性预测谱包络的影响很大,阶数较低时,线性预测谱包络较为滑不够准确,阶数较高时,所得的谱包络受基频的影响严重且常常比较尖锐,而基于语音信号幅度谱包络的求取的线性预测系数可以很好地克服预测系数选取选取带来的误差。因此,本文讨论用降噪之后语音信号的幅度谱来求取线性预测系数,并且选用协方差格型法的方法进行LPC分析,提高预测系数的准确性,并用得到的LPC系数进行逆滤波求取基音频率,谱包络分析求取前三个共振峰的频率。并将该方法得到的语音频率参数和简易逆滤波法求取基音频率及线性预测法求取共振峰频率进行比较,通过Matlab的仿真可知,该方法在低信噪比下误检率较低,性能较好。另外,对于语音信号的后处理,本文分析讨论了一种中值滤波方法,考虑到语音频率检测中可能出现野点等情况,在求取语音频率参数之后,用所讨论的中值滤波方法进行滤波,可得到较平滑的语音频率参数轨迹。然后,在Matlab平台上通过其自带的GUI设计界面,将所设计的方法进行整合,生成一个能检测出基音频率和前三共振峰频率的软件。该软件能实现从本地上传语音文件和现场录音两种方式得到语音数据,可通过选择相应的控制选项将检测结果显示在界面上,并可选择某帧数据将其具体的参数数据显示在界面右边。最后,对全文所做的工作进行概括分析,并对语音频率参检测的以后的研究方向前景进行简单的介绍和展望。

全文目录


摘要  4-6
Abstract  6-10
第一章 绪论  10-15
  1.1 引言  10-11
  1.2 国内外研究动态  11-12
    1.2.1 基音频率估计研究动态  11-12
    1.2.2 共振峰频率估计研究动态  12
  1.3 面临的主要问题  12-13
  1.4 论文主要工作  13-14
  1.5 本文的组织结构  14-15
第二章 语音信号处理基础知识  15-34
  2.1 语音信号产生与特点  15-17
  2.2 语音信号的产生模型与线性预测分析  17-25
    2.2.1 语音信号的产生模型  17-19
    2.2.2 语音信号的线性预测分析  19-25
  2.3 语音信号的预处理  25-27
    2.3.1 预加重  25-26
    2.3.2 语音信号的分帧处理  26-27
  2.4 语音端点检测  27-33
    2.4.1 短时平均能量  27-28
    2.4.2 短时平均过零率  28-30
    2.4.3 基于短时过零率和短时能量的双门限比较法  30-31
    2.4.4 基于短时过零率和短时自相关的浊音端点检测  31-33
  2.5 本章小结  33-34
第三章 语音频率参数估计的常用算法  34-49
  3.1 引言  34
  3.2 基音频率估计  34-43
    3.2.1 短时自相关函数  34-37
    3.2.2 短时平均幅度差函数法  37-39
    3.2.3 同态处理方法  39-41
    3.2.4 简易逆滤波法  41-43
    3.2.5 语音基音频率估计小结  43
  3.3 共振峰频率估计常用算法  43-48
    3.3.1 短时傅里叶变换法  43-45
    3.3.2 同态处理技术(倒谱法)  45-46
    3.3.3 基于线性预测分析(LPC)的共振峰求取法  46-47
    3.3.4 语音共振峰频率估计小结  47-48
  3.4 本章总结  48-49
第四章 低信噪比下语音频率参数的估计  49-63
  4.1 噪声对语音信号的影响  49-50
  4.2 减少噪声影响的原理与方法分析  50-54
  4.3 基于线性预测的语音频率估计方法  54-61
    4.3.1 线性预测分析(LPC)的频域特性  54-57
    4.3.2 基于幅度谱包络的线性预测系数(LPC)求取  57-58
    4.3.3 基于谱减法和幅度谱包络线性预测分析的语音频率参数估计  58-60
    4.3.4 改进的中值滤波算法  60-61
  4.4 本章小结  61-63
第五章 语音频率参数估计的实现  63-66
  5.1 系统的总体设计方案  63-64
  5.2 实现方法与结果  64-65
  5.3 本章小结  65-66
第六章 论文总结与展望  66-68
  6.1 总结  66-67
  6.2 本文的不足与展望  67-68
致谢  68-69
参考文献  69-72
个人简介  72-73

相似论文

  1. 网络语音传输丢包的恢复技术,TN912.3
  2. 基于∑-Δ调制的水声信号发射机研究,TN761
  3. 基于量子搜索的Ad Hoc网络路由协议研究,TN929.5
  4. 圆形钢管应力磁芯感应式电磁测试实验研究,TU392.3
  5. 数字助听器中汉语语音处理及语音增强的研究,TN912.3
  6. OFDM基带自适应调制与编码算法的研究与实现,TN911.22
  7. 数字助听器中语音增强技术的研究,TN912.35
  8. MIMO系统信道容量的研究与分析,TN919.3
  9. 随机行列循环移位交织器及量子交织器的研究,TN911.22
  10. 低对比度图像中微弱小目标的检测研究,TP391.41
  11. 谱域多普勒光学相干层析成像算法研究,TP391.41
  12. 基于二元光学的耦合透镜与阵列天线研究,TN820.15
  13. SAR图像可匹配性研究,TN957.52
  14. NMR测井仪传感器分析及其噪声匹配研究,TP212
  15. 图像质量对立体定位精度影响的若干问题的研究,TP391.41
  16. 微光像增强器的噪声特性研究,TN144
  17. 毫米波探测器的信号分析与处理器设计,TN911.6
  18. 小尺度人工震源地震波速变化观测系统的技术研究,P631.4
  19. 提高地震资料高频段信噪比及拓展有效频宽方法研究,P631.4
  20. 分布式光纤扰动监测系统信号调理技术的研究,TN911.3
  21. 硅麦克风前置放大器设计研究,TN722.71

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com