学位论文 > 优秀研究生学位论文题录展示

低速率语音编码参数高效量化算法研究

作 者: 许明
导 师: 唐昆
学 校: 清华大学
专 业: 信息与通信工程
关键词: 语音编码 矢量量化 级间预测 码本联合优化 0.15kb/s语音编码
分类号: TN912.3
类 型: 硕士论文
年 份: 2009年
下 载: 66次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音的数字编码传输是数字通信网中最重要最基本的内容之一。为了满足无线通信等众多领域的需求,2.4 kb/s甚至更低速率(如1.2-0.6kb/s)语音编码技术一直是语音编码中重要的研究课题。但某些带宽受限的应用领域,迫切需要一些更低速率(如0.3kb/s以及0.15kb/s)的语音编码算法。本文以正弦激励线性预测(SELP)声码器为模型,着重介绍了0.3kb/s声码器参数高效量化方法以及0.15kb/s声码器的初步架构实现。SELP是一种高质量低速率的语音编码算法模型。以此模型为基础,语音的编解码传输过程中,当速率较低时,受可用比特数的限制,参数的高效量化技术将直接影响到合成语音的清晰度和准确度。本文介绍了两种改进的参数量化方法:带有帧间级间预测的多级矢量量化技术和多参数多码本尺寸联合优化技术。原有声码器中,多级矢量量化时,并没有考虑各级之间的相关性,因而并没有完全消除信息冗余。本文所采用的带级间预测的矢量量化算法,在去除帧间相关性的同时,也去除级间相关性,可以降低运算量和存储量。而在原有算法中,参数在不同模式下采用相同尺寸的码本,没有考虑各模式的统计特性,不能达到最优的量化效果。本文采用的联合优化算法利用统计特性,联合分配码本尺寸。仿真结果表明,这两种方法可以有效降低参数量化的误差,提高合成语音的清晰度和可懂度。而0.15kb/s语音编码算法是目前此领域最为领先的研究课题。本文介绍了一种该速率下声码器的初步架构方案,并给出简单的测试结果,更多深入的研究还需要进一步尝试。

全文目录


摘要  3-4
Abstract  4-8
第1章 引言  8-19
  1.1 应用背景  8-9
  1.2 低速率语音编码基础  9-12
    1.2.1 语音信号的特性  9-10
    1.2.2 低速率语音编码模型  10
    1.2.3 参数编码的关键技术  10-12
  1.3 现代低速率语音编码算法  12-16
    1.3.1 混合激励线性预测(MELP)编码算法  12-13
    1.3.2 波形插值(WI)算法  13-14
    1.3.3 正弦变换编码(STC)算法  14
    1.3.4 多带激励(MBE)算法  14-16
  1.4 甚低速率语音编码算法的新进展  16-17
  1.5 论文工作的背景、意义和本文安排  17-19
第2章 语音编码基础  19-30
  2.1 语音编码理论概述  19-20
  2.2 SELP 算法概述  20-29
    2.2.1 SELP 模型分析算法  20-25
    2.2.2 SELP 模型合成算法  25-29
  2.3 本章小结  29-30
第3章 带有帧间级间预测的线谱频率参数多级矢量量化技术  30-42
  3.1 基本概念  30-32
    3.1.1 矢量量化  30-31
    3.1.2 多级矢量量化  31-32
    3.1.3 声码器中的MSVQ  32
  3.2 带有帧间级间预测的LSF 参数多级矢量量化算法  32-39
    3.2.1 IFP-MSVQ 算法原理  32-35
    3.2.2 IFP-MSVQ-ISP 算法的理论依据  35-36
    3.2.3 IFP-MSVQ-ISP 算法详细描述  36-39
  3.3 测试结果  39-40
  3.4 结论  40-42
第4章 基于模式的多矢量多码本尺寸联合优化算法  42-53
  4.1 基于模式的多码本矢量量化算法  42-43
  4.2 基于模式的多矢量多码本尺寸联合优化算法  43-47
    4.2.1 训练带通清浊音参数码本并确定超帧模式  44-45
    4.2.2 基音周期参数码本尺寸优化  45-46
    4.2.3 线谱频率参数码本尺寸调整  46-47
    4.2.4 短时帧能量参数码本尺寸调整  47
  4.3 测试结果及结论  47-51
  4.4 总结  51-53
第5章 基于 SELP 模型的 150bps 声码器  53-60
  5.1 比特分配方案  53-54
  5.2 模糊带通浊音度参数  54
  5.3 基音周期参数搜索算法改进  54-55
  5.4 短时帧能量参数的量化方案  55
  5.5 带有级间预测的线谱对参数多级矢量量化方案  55-56
  5.6 带有级间预测的线谱对参数多级码本联合优化  56-58
  5.7 测试结果  58-59
  5.8 总结  59-60
第6章 算法的定点化及汇编语言实现  60-65
  6.1 浮点算法的定点化  60-63
    6.1.1 接口参数的定点化  61-62
    6.1.2 函数内部定点改写  62-63
    6.1.3 定点程序性能的度量  63
  6.2 DSP 实时实现  63-64
  6.3 本章小结  64-65
第7章 总结  65-67
参考文献  67-74
致谢  74-75
个人简历、在学期间发表的学术论文与研究成果  75

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  3. iLBC语音编码技术的研究及DSP的设计与优化,TN912.3
  4. 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
  5. 压缩感知算法及其在矢量量化中的应用,TN911.7
  6. Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
  7. 语音人工带宽扩展算法研究,TN912.3
  8. 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
  9. 甚低速率语音编码器算法研究,TN912.3
  10. 端到端保密通信中的类语音调制解调研究,TN918
  11. AMR-WB+编码算法关键技术及码流识别研究,TN912.3
  12. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  13. 基于MELP的低速率语音编码算法研究,TN912.3
  14. MELPe语音编码关键技术研究,TN912.3
  15. 基于文本无关的说话人识别研究,TN912.34
  16. 高速公路交通事件检测建模及应用研究,U491.116
  17. 多路并行实时说话人识别算法研究与实现,TN912.34
  18. 基于ML2724扩频通信系统的研究与应用,TN914.42
  19. 自适应低速率语音编解码研究与实现,TN912.3
  20. 基于语音信号特征的语音零水印,TP309.7

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com