学位论文 > 优秀研究生学位论文题录展示

网络语音传输丢包的恢复技术

作 者: 陈弢
导 师: 韩纪庆
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 语音通信 丢包恢复 码激励线性预测编码 G.723.1 信噪比 巴克谱失真 隐马尔科夫模型
分类号: TN912.3
类 型: 硕士论文
年 份: 2008年
下 载: 72次
引 用: 1次
阅 读: 论文下载
 

内容摘要


语音通信对实时性和连续性都有较高要求,但现在的网络(IPv4)只提供一种尽力而为(Best-effort)的服务,网络拥塞的发生会导致丢包和延时,从而使得话音质量严重下降,因此为了确保服务质量(Quality of Service,QoS),需要采取应对策略来降低丢包和延时对语音质量造成的不良影响。基于接收端的语音丢包恢复策略已经成为一个决定通信话音质量的重要因素。本文主要研究基于接收端的语音丢包恢复技术,改进和设计了一系列的算法实现对码激励线性预测编码(Code Excited Linear Predictive Coding,简称CELP)框架的语音丢失帧的恢复来改善话音质量。首先研究了应用广泛的CELP框架编码器和G.723.1语音编码,设计了一个丢包模型来较好的模拟网络丢包状况,从而能够在此模型上实现丢包恢复算法。然后先探讨了在时域波形上的语音丢包恢复算法,以及在CELP的参数域上的基于参数复制和交叠插值方法的丢包恢复算法,在此基础上改进和设计了基于声音驱动的丢包补偿算法,其相比较之前的恢复算法对清浊音判断和转接段估计,语音信号幅值的趋势变化几个方面进行了更精确处理,并使用信噪比评价实验结果验证了其更好的恢复效果。之前的丢包恢复算法都忽视了语音信号的统计学变化规律会导致恢复信号在听觉感官上的不自然。针对这一问题,我们引入了统计学方法,不再把丢失帧参数看成是一个确定值而是一个混合高斯分布GMM(Gaussian Mixture Model),并利用HMM(Hidden Markov Model)来描述语音信号的随机变化过程,从概率上来估计丢失语音参数,在理论上对于丢失帧的恢复能得到更好的听觉效果。最后使用巴克谱失真这种接近感官听觉标准的语音质量的客观评价方法来对我们的算法进行评价。实验结果表明,引入基于HMM模型的丢包恢复算法相比之前的恢复算法具有更好的恢复效果。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-14
  1.1 课题背景  9
  1.2 国内外研究现状  9-12
    1.2.1 基于发送端的恢复技术  10-11
    1.2.2 基于接收端的恢复技术  11-12
  1.3 本文的研究内容  12-14
第2章 CELP框架和网络丢包模型与检测  14-22
  2.1 CELP编解码器的原理  14-17
    2.1.1 CELP语音编码过程  14-16
    2.1.2 CELP语音解码过程  16
    2.1.3 G.723.1 编解码原理  16-17
  2.2 网络语音丢包的模拟  17-19
    2.2.1 伯努利丢失模型  17-18
    2.2.2 吉尔伯特模型  18-19
  2.3 丢包检测机制  19-21
  2.4 本章小结  21-22
第3章 基于插值的丢包恢复算法  22-39
  3.1 基于波形插值的丢失帧恢复算法  22-26
    3.1.1 语音信号波形插值算法  22-23
    3.1.2 基于LPC模型的恢复算法  23-26
  3.2 针对CELP框架的参数恢复算法  26-35
    3.2.1 参数复制和交叠插值恢复方法  27-28
    3.2.2 G.723.1 编码的帧间插值策略  28-30
    3.2.3 基于声音驱动的恢复算法  30-35
  3.3 算法恢复效果的评价方法  35-36
  3.4 各个算法的实验结果及分析  36-38
  3.5 本章小结  38-39
第4章 基于HMM的丢包恢复算法  39-51
  4.1 引言  39
  4.2 引入HMM的丢包恢复算法  39-46
    4.2.1 HMM的基本原理  39-41
    4.2.2 丢包恢复的HMM 方法  41-46
  4.3 巴克谱失真测度  46-48
  4.4 算法实验结果分析与比较  48-50
  4.5 本章小结  50-51
结论  51-52
参考文献  52-57
致谢  57

相似论文

  1. 基于∑-Δ调制的水声信号发射机研究,TN761
  2. OFDM基带自适应调制与编码算法的研究与实现,TN911.22
  3. MIMO系统信道容量的研究与分析,TN919.3
  4. 随机行列循环移位交织器及量子交织器的研究,TN911.22
  5. 图像质量对立体定位精度影响的若干问题的研究,TP391.41
  6. 基于3G移动通信的视频监控系统研究,TP277
  7. 硅麦克风前置放大器设计研究,TN722.71
  8. 一种高性能四阶∑-Δ调制器的设计与分析,TN761
  9. 地震资料随机干扰压制技术研究,P631.44
  10. G.723.1协议及相关通信业务在嵌入式系统上的实现,TN919.8
  11. 用于音频的Sigma-Delta调制器设计,TN761
  12. 大气背景测量多通道光学系统及其测量能力研究,TH765.84
  13. 连续时间Sigma-Delta调制器设计,TN761
  14. 基于DMD的微小型近红外光谱仪光谱信息处理及其应用软件,TH744.1
  15. ZigBee技术在语音通信中的路由协议研究与实现,TN919.8
  16. 基于DBR光纤激光器的自混合效应研究,TN248
  17. 分布式光纤白光干涉偏振特性研究,O436.3
  18. G.726语音编码的分析研究及在嵌入式AdHoc网络上的实现,TN929.5
  19. 基于ZigBee技术的语音通信系统设计与实现,TN919.8
  20. 水下小型语音通信平台硬件设计及调试,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com