学位论文 > 优秀研究生学位论文题录展示

基于条件高斯混合模型的宽带ISF参数分裂矢量量化研究

作 者: 刘晴晴
导 师: 陈立伟
学 校: 哈尔滨工程大学
专 业: 信号与信息处理
关键词: 矢量量化 导抗谱频率 条件高斯混合模型 帧间相关性
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 18次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音编码的参数矢量量化一直是研究热点。当前ITU-T和3GPP等国际标准组织制定的语音编码标准中采用了以分裂矢量量化为基础的算法,这些算法有训练简单、计算复杂度低等优点,但同时也存在比特率高的缺点。近十年来,国外的研究重点逐渐转向以高斯混合模型为基础的参数矢量量化算法。本文的工作即在条件高斯混合模型的基础上展开。论文回顾了国内外矢量量化算法的研究历史和现状,介绍了待量化参数——ISF参数的意义及特点。详述了传统码书训练算法LBG的特性以及训练码书的失真测度。用条件高斯混合模型为训练数据建模,有效地利用了训练参数间的帧间相关性,进而利用该相关性训练出更有针对性的码书。在该种方法的基础上,提出了完整的宽带ISF参数矢量量化算法SFSVQ和SSSVQ,二者分别利用了ISF参数间(16维)的帧间相关性和ISF子帧(3维或4维)的帧间相关性。最后,从谱失真、计算复杂度、存储复杂度等方面分析了SFSVQ和SSSVQ算法的性能。

全文目录


摘要  5-6
ABSTRACT  6-9
第1章 绪论  9-14
  1.1 课题背景  9-11
  1.2 国内外研究现状  11-12
  1.3 课题研究意义  12-13
  1.4 研究内容及章节安排  13-14
第2章 线性预测分析  14-22
  2.1 线性预测分析的基本原理  14-16
  2.2 线性预测系数的解法  16-18
  2.3 导抗谱频率分析  18-21
    2.3.1 导抗谱频率参数的定义和性质  18-19
    2.3.2 由线性预测系数求导抗谱频率参数  19-20
    2.3.3 由导抗谱频率参数求线性预测系数  20-21
  2.4 小结  21-22
第3章 码书训练与失真测度研究  22-31
  3.1 矢量量化器设计算法概述  22-23
  3.2 LBG算法特性  23-27
    3.2.1 平均失真单调不增性  24-25
    3.2.2 数据分布的无关性  25-27
  3.3 失真测度分析  27-30
    3.3.1 欧几里德测度  27-28
    3.3.2 信噪比  28-29
    3.3.3 谱失真测度  29-30
  3.4 小结  30-31
第4章 SFSVQ和SSSVQ的数据分类及码书训练  31-40
  4.1 高斯混合模型概述  31-33
    4.1.1 高斯混合模型参数训练  31-32
    4.1.2 条件高斯混合模型的建立  32-33
  4.2 数据分类及码书训练  33-34
  4.3 码书性能实验分析  34-39
    4.3.1 基于条件高斯混合模型的码书欧几里德测度实验及性能分析  34-37
    4.3.2 基于条件高斯混合模型的码书谱失真测度实验及性能分析  37-39
  4.4 小结  39-40
第5章 SFSVQ和SSSVQ性能分析  40-52
  5.1 矢量量化的技术指标  40-41
  5.2 编码流程  41-43
    5.2.1 SFSVQ的编码流程  41-42
    5.2.2 SSSVQ的编码流程  42-43
  5.3 仿真实验及性能分析  43-50
    5.3.1 谱失真  43-47
    5.3.2 计算复杂度  47-50
    5.3.3 存储复杂度  50
  5.4 小结  50-52
结论  52-54
参考文献  54-58
攻读硕士学位期间发表的论文和取得的科技成果  58-59
致谢  59

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
  3. 压缩感知算法及其在矢量量化中的应用,TN911.7
  4. Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
  5. 语音人工带宽扩展算法研究,TN912.3
  6. 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
  7. 甚低速率语音编码器算法研究,TN912.3
  8. 端到端保密通信中的类语音调制解调研究,TN918
  9. AMR-WB+编码算法关键技术及码流识别研究,TN912.3
  10. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  11. 基于MELP的低速率语音编码算法研究,TN912.3
  12. 基于文本无关的说话人识别研究,TN912.34
  13. 高速公路交通事件检测建模及应用研究,U491.116
  14. 多路并行实时说话人识别算法研究与实现,TN912.34
  15. 低速率语音编码参数高效量化算法研究,TN912.3
  16. 基于语音信号特征的语音零水印,TP309.7
  17. 噪声环境下的说话人识别研究,TN912.34
  18. 基于SOM的入侵检测算法的研究与改进,TP393.08
  19. 基于小波变换和矢量量化的图像压缩编码研究,TP391.41
  20. 基于视频的运动分析关键技术研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com