学位论文 > 优秀研究生学位论文题录展示

基于瞬时幅度加噪声模型的语音压缩

作　者: 余聪
导　师: 李刚
学　校: 浙江工业大学
专　业: 信号与信息处理
关键词: 瞬时幅度+噪声正弦+噪声语音编码包络拟合 MATLAB GUI
分类号: TN912.3
类　型: 硕士论文
年　份: 2009年
下　载: 12次
引　用: 0次
阅　读: 论文下载

内容摘要

随着信息技术的发展,信道资源越来越宝贵,为了提高存储效率和减小存储空间,在允许的失真条件下,如何设计/实现高质量的低速率语音编码器是当前的热点之一。现如今,采用单一的编码技术很难满足上述要求,混合编码技术已成为语音编码的优选方向。本文研究了一种确定分量和随机分量组合的语音信号表示模型——瞬时幅度+噪声模型,它是正弦+噪声模型的一种改进型结构。正弦+噪声模型是一种谱模型结构,它利用人类对声音的感知特性,将声音的周期分量以正弦的时变幅度、频率和相位形式来表示,剩余的非周期分量(残差信号)用已滤波的噪声形式呈现。因为周期分量的不稳定性,在语音信号中,估计正弦模型的参数是一项十分困难的任务,进行正弦轨迹的匹配和相位参数的平滑也是相当繁琐的工作,同时也很难达到较高的时间和频率分辨率。因此,我们提出了一种改进型正弦模型——瞬时幅度(IA)模型。该模型主要是把正弦模型中难估计的相位参数转化为对两个瞬时幅度参数的估计,从算法的实现角度上做了简化。同时对频率参数的估计采用了一种迭代的方法,利用该方法提取出的正弦分量都是相对人耳最重要的成分,从而使得合成的语音在质量上得到了相对提高。对于剩余的非周期分量我们采用线性预测分析合成原理,建立一个全极点声道模型,然后估算并传输模型参数和激励参数。对瞬时幅度+噪声模型提取的参数分别进行编码传输,对于正弦分量的幅度参数提出了一种多项式包络拟合的方法。而对于线性预测(LP)系数,由于量化后再传输会对系统造成不稳定的现象,因此将其变换成更适合编码和传输的参数——线谱频率(LSF)参数。通过对模型参数的量化、编码和解码,我们设计了一个编码速率为10.72 kb/s的语音编解码器。同时,本文设计了一个MATLAB用户图形界面(GUI)。我们将仿真后的数据都储存在该界面中,并通过对界面上的按键操作实现相应的功能,例如播放语音,显示语音的波形图等功能。通过大量的实验数据和平均意见得分(MOS)主观测听评价得出,本文基于瞬时幅度+噪声模型设计的语音编解码器具有较好的性能,合成的语音无论在质量上还是在压缩率方面都较传统方法有了大的提高。因此瞬时幅度+噪声模型对设计低速率高音质的语音编码具有较高的研究价值。

全文目录

符号说明  5-7
摘要  7-8
ABSTRACT  8-13
插图  13-15
表格  15-16
第1章绪论  16-21
  1.1 选题背景和意义  16-17
  1.2 国内外的研究现状及趋势  17-19
  1.3 本文的研究目标和内容  19-21
    1.3.1 研究目标  19
    1.3.2 研究内容  19-20
    1.3.3 章节安排  20-21
第2章语音信号及语音编码  21-32
  2.1 语音信号的基础知识  21-24
    2.1.1 发声器官  21
    2.1.2 清音、浊音和爆破音  21-22
    2.1.3 基音频率  22
    2.1.4 共振峰  22
    2.1.5 语谱图  22-23
    2.1.6 语音的波形特征  23-24
  2.2 语音信号的时域分析  24-28
    2.2.1 语音短时分析  24-26
    2.2.2 短时能量和平均幅度  26-27
    2.2.3 短时平均过零率  27-28
  2.3 语音编码技术简介  28-29
    2.3.1 语音信号的数字模型  28-29
    2.3.2 语音编码的分类  29
  2.4 语音编码的性能评价方法  29-31
  2.5 MATLAB GUI概述  31
  2.6 本章小结  31-32
第3章正弦加噪声模型  32-40
  3.1 正弦模型  33-38
    3.1.1 正弦模型的参数估计  33-34
    3.1.2 语音信号的正弦分解  34-35
    3.1.3 频率匹配  35-37
    3.1.4 正弦参数的合成  37-38
  3.2 噪声模型  38-39
  3.3 本章小结  39-40
第4章 IA加噪声模型及参数估计/提取  40-47
  4.1 IA模型  40-44
    4.1.1 IA模型的建模  40-42
    4.1.2 参数优化  42
    4.1.3 频率估计  42-44
  4.2 噪声模型  44-46
  4.3 本章小结  46-47
第5章基于IA加噪声模型的语音编解码器  47-58
  5.1 IA模型的编码  47-51
    5.1.1 包络拟合  47-49
    5.1.2 参数量化编码  49-51
  5.2 基于IA模型的参数解码  51
  5.3 噪声模型的编码  51-56
    5.3.1 基音周期估计  51-52
    5.3.2 LP参数到LSF参数的转换  52-56
    5.3.3 参数量化编码  56
  5.4 噪声模型的解码  56
  5.5 激励码本  56
  5.6 IA加噪声模型的编码与解码  56-57
  5.7 本章小结  57-58
第6章仿真与性能测试  58-69
  6.1 IA模型、IA_1模型与MQ模型的比较  58-61
  6.2 IA加噪声模型的语音解码  61-64
    6.2.1 IA模型解码后的合成语音  61-63
    6.2.2 噪声模型解码后的合成残差信号  63-64
  6.3 基于IA加噪声模型的语音编解码器的性能测试  64-69
    6.3.1 模拟结果  65
    6.3.2 合成语音主观测听质量测试  65-68
    6.3.3 本章小结  68-69
第7章总结与展望  69-72
  7.1 总结  69-70
  7.2 进一步研究与展望  70-72
参考文献  72-76
致谢  76-77
攻读学位期间参加的科研项目和成果  77

基于瞬时幅度加噪声模型的语音压缩

内容摘要

全文目录

相似论文