学位论文 > 优秀研究生学位论文题录展示

基于瞬时幅度加噪声模型的语音压缩

作 者: 余聪
导 师: 李刚
学 校: 浙江工业大学
专 业: 信号与信息处理
关键词: 瞬时幅度+噪声 正弦+噪声 语音编码 包络拟合 MATLAB GUI
分类号: TN912.3
类 型: 硕士论文
年 份: 2009年
下 载: 12次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息技术的发展,信道资源越来越宝贵,为了提高存储效率和减小存储空间,在允许的失真条件下,如何设计/实现高质量的低速率语音编码器是当前的热点之一。现如今,采用单一的编码技术很难满足上述要求,混合编码技术已成为语音编码的优选方向。本文研究了一种确定分量和随机分量组合的语音信号表示模型——瞬时幅度+噪声模型,它是正弦+噪声模型的一种改进型结构。正弦+噪声模型是一种谱模型结构,它利用人类对声音的感知特性,将声音的周期分量以正弦的时变幅度、频率和相位形式来表示,剩余的非周期分量(残差信号)用已滤波的噪声形式呈现。因为周期分量的不稳定性,在语音信号中,估计正弦模型的参数是一项十分困难的任务,进行正弦轨迹的匹配和相位参数的平滑也是相当繁琐的工作,同时也很难达到较高的时间和频率分辨率。因此,我们提出了一种改进型正弦模型——瞬时幅度(IA)模型。该模型主要是把正弦模型中难估计的相位参数转化为对两个瞬时幅度参数的估计,从算法的实现角度上做了简化。同时对频率参数的估计采用了一种迭代的方法,利用该方法提取出的正弦分量都是相对人耳最重要的成分,从而使得合成的语音在质量上得到了相对提高。对于剩余的非周期分量我们采用线性预测分析合成原理,建立一个全极点声道模型,然后估算并传输模型参数和激励参数。对瞬时幅度+噪声模型提取的参数分别进行编码传输,对于正弦分量的幅度参数提出了一种多项式包络拟合的方法。而对于线性预测(LP)系数,由于量化后再传输会对系统造成不稳定的现象,因此将其变换成更适合编码和传输的参数——线谱频率(LSF)参数。通过对模型参数的量化、编码和解码,我们设计了一个编码速率为10.72 kb/s的语音编解码器。同时,本文设计了一个MATLAB用户图形界面(GUI)。我们将仿真后的数据都储存在该界面中,并通过对界面上的按键操作实现相应的功能,例如播放语音,显示语音的波形图等功能。通过大量的实验数据和平均意见得分(MOS)主观测听评价得出,本文基于瞬时幅度+噪声模型设计的语音编解码器具有较好的性能,合成的语音无论在质量上还是在压缩率方面都较传统方法有了大的提高。因此瞬时幅度+噪声模型对设计低速率高音质的语音编码具有较高的研究价值。

全文目录


符号说明  5-7
摘要  7-8
ABSTRACT  8-13
插图  13-15
表格  15-16
第1章 绪论  16-21
  1.1 选题背景和意义  16-17
  1.2 国内外的研究现状及趋势  17-19
  1.3 本文的研究目标和内容  19-21
    1.3.1 研究目标  19
    1.3.2 研究内容  19-20
    1.3.3 章节安排  20-21
第2章 语音信号及语音编码  21-32
  2.1 语音信号的基础知识  21-24
    2.1.1 发声器官  21
    2.1.2 清音、浊音和爆破音  21-22
    2.1.3 基音频率  22
    2.1.4 共振峰  22
    2.1.5 语谱图  22-23
    2.1.6 语音的波形特征  23-24
  2.2 语音信号的时域分析  24-28
    2.2.1 语音短时分析  24-26
    2.2.2 短时能量和平均幅度  26-27
    2.2.3 短时平均过零率  27-28
  2.3 语音编码技术简介  28-29
    2.3.1 语音信号的数字模型  28-29
    2.3.2 语音编码的分类  29
  2.4 语音编码的性能评价方法  29-31
  2.5 MATLAB GUI概述  31
  2.6 本章小结  31-32
第3章 正弦加噪声模型  32-40
  3.1 正弦模型  33-38
    3.1.1 正弦模型的参数估计  33-34
    3.1.2 语音信号的正弦分解  34-35
    3.1.3 频率匹配  35-37
    3.1.4 正弦参数的合成  37-38
  3.2 噪声模型  38-39
  3.3 本章小结  39-40
第4章 IA加噪声模型及参数估计/提取  40-47
  4.1 IA模型  40-44
    4.1.1 IA模型的建模  40-42
    4.1.2 参数优化  42
    4.1.3 频率估计  42-44
  4.2 噪声模型  44-46
  4.3 本章小结  46-47
第5章 基于IA加噪声模型的语音编解码器  47-58
  5.1 IA模型的编码  47-51
    5.1.1 包络拟合  47-49
    5.1.2 参数量化编码  49-51
  5.2 基于IA模型的参数解码  51
  5.3 噪声模型的编码  51-56
    5.3.1 基音周期估计  51-52
    5.3.2 LP参数到LSF参数的转换  52-56
    5.3.3 参数量化编码  56
  5.4 噪声模型的解码  56
  5.5 激励码本  56
  5.6 IA加噪声模型的编码与解码  56-57
  5.7 本章小结  57-58
第6章 仿真与性能测试  58-69
  6.1 IA模型、IA_1模型与MQ模型的比较  58-61
  6.2 IA加噪声模型的语音解码  61-64
    6.2.1 IA模型解码后的合成语音  61-63
    6.2.2 噪声模型解码后的合成残差信号  63-64
  6.3 基于IA加噪声模型的语音编解码器的性能测试  64-69
    6.3.1 模拟结果  65
    6.3.2 合成语音主观测听质量测试  65-68
    6.3.3 本章小结  68-69
第7章 总结与展望  69-72
  7.1 总结  69-70
  7.2 进一步研究与展望  70-72
参考文献  72-76
致谢  76-77
攻读学位期间参加的科研项目和成果  77

相似论文

  1. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  2. 用户权限管理系统可靠性测试的研究与应用,TP311.53
  3. iLBC语音编码技术的研究及DSP的设计与优化,TN912.3
  4. 基于数据挖掘的故障诊断方法研究,TP311.13
  5. 甚低速率语音编码器算法研究,TN912.3
  6. 基于MELP的低速率语音编码算法研究,TN912.3
  7. MELPe语音编码关键技术研究,TN912.3
  8. 多层圆筒非定常稳态传热的计算,TF061.21
  9. 基于ML2724扩频通信系统的研究与应用,TN914.42
  10. 自适应低速率语音编解码研究与实现,TN912.3
  11. 低速率语音编码参数高效量化算法研究,TN912.3
  12. 滑动轴承网上虚拟平台,TH133.31
  13. 地震现场信息采集无线传输系统,TP274.2
  14. 基于气压仿真开发平台的油压测控试验系统的设计,TP273
  15. G.726语音编码的分析研究及在嵌入式AdHoc网络上的实现,TN929.5
  16. 基于DSP的语音编解码系统研究,TN912.3
  17. 基于数字对讲机的MELP声码器算法研究与实现,TN912.3
  18. 水下小型语音通信平台硬件设计及调试,TN912.3
  19. 基于AMR标准的语音编码VLSI设计,TN912.3
  20. AMR语音编码器,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com