学位论文 > 优秀研究生学位论文题录展示

汉语耳语音重建的研究

作　者: 黄程
导　师: 陶亮
学　校: 安徽大学
专　业: 计算机应用技术
关键词: 混合激励线性预测模型端点检测声韵分割共振峰修正基频添加连续耳语音重建
分类号: TN912.3
类　型: 硕士论文
年　份: 2013年
下　载: 7次
引　用: 0次
阅　读: 论文下载

内容摘要

耳语音是人与人之间一种特殊的语音交流方式。其具有声带不振动、基频缺失和声音能量低的特性,这些特性降低了耳语音的可懂度和清晰度。耳语音向正常音的转换重建具有重要的理论意义和应用价值。本文基于混合激励线性预测模型,研究了连续汉语耳语音合成重建正常语音的相关技术,主要工作包括：建立了基于混合激励线性预测(MELP)模型的连续汉语耳语音向正常音的转换模型。对耳语音和相应正常语音的混合激励线性预测(MELP)模型的编码参数进行了比较分析。提出了基于Gabor变换的时频域信息熵和过零率的端点检测方法。首先利用信息熵来区分语音的有声段和无声段。其次针对连续耳语音中利用信息熵的端点检测存在着耳语音的语音段误判为无声段这一缺点,利用过零率方法对端点检测的熵值相近熵阈值的语音帧进行修正。提出了基于Gabor时频域对称相对熵的声韵分割方法。在声韵分割中,利用声母和韵母的能量聚集性、共振峰结构以及频谱差异,采用对称相对熵值来分割声母和韵母。实现了基于线谱对(LSP)的共振峰修正,对共振峰的峰值位置和带宽进行修改。在对耳语音中的韵母部分添加基频时,首先基于Bark频带域的功率谱和声调的关系,来判别语音的声调的类型,进而对耳语音声调进行识别,然后利用五度字调模型对语音帧添加基频信息。最后利用修正后的参数实现了基于MELP模型的耳语音向正常音的重建。实验结果表明,该方法能重建较为自然流畅的正常音。

全文目录

摘要  3-4
Abstract  4-5
目录  5-7
第一章绪论  7-10
  1.1 背景及意义  7-8
  1.2 耳语音重建研究的概况  8-9
  1.3 研究内容、目标以及解决的问题  9
  1.4 论文内容与安排  9-10
第二章混合激励线性预测模型  10-22
  2.1 概述  10-11
    2.1.1 MELP声码器的基本原理  10
    2.1.2 MELP声码器模型的概述  10-11
  2.2 MELP编码器算法  11-16
    2.2.1 基音提取  11-13
    2.2.2 子带语音分析  13-14
    2.2.3 线性预测分析  14
    2.2.4 增益估计  14-15
    2.2.5 傅里叶级数幅值的计算和量化  15-16
  2.3 MELP解码器算法  16-21
    2.3.1 噪声抑制  16-17
    2.3.2 参数插值  17-18
    2.3.3 混合激励的产生  18-19
    2.3.4 自适应谱增强  19-20
    2.3.5 线性预测合成  20
    2.3.6 增益调整  20
    2.3.7 脉冲整形  20-21
  2.4 MELP声码器的合成结果  21-22
第三章 MELP模型中耳语音和正常音的参数差异分析  22-30
  3.1 引言  22-23
  3.2 基音周期  23-26
    3.2.1 基音周期的定义  23
    3.2.2 基频检测  23-25
    3.2.3 耳语音和正常语音的基音周期  25-26
  3.3 语音共振峰  26-27
    3.3.1 共振峰的定义  26
    3.3.2 共振峰的估计  26-27
    3.3.3 耳语音和正常语音的共振峰  27
  3.4 其它参数  27-28
    3.4.1 抖动系数  27-28
    3.4.2 增益  28
  3.5 基于MELP的耳语音重建模型  28-30
第四章基于MELP模型的耳语音重建  30-51
  4.1 引言  30
  4.2 耳语音的端点检测  30-36
    4.2.1 基于Gabor变换的时频域的端点检测  30-32
    4.2.2 耳语音的端点检测修正  32
    4.2.3 耳语音端点检测的实验结果  32-34
    4.2.4 基于过零率的耳语音端点检测修正  34-36
  4.3 耳语音的声韵分割  36-38
    4.3.1 耳语音的声韵分割  36-37
    4.3.2 连续耳语音的声韵分割  37
    4.3.3 耳语音声韵分割的结果  37-38
  4.4 共振峰的修正  38-42
    4.4.1 线性谱域的共振峰修正  38-42
    4.4.2 共振峰修正的结果  42
  4.5 添加基频  42-47
    4.5.1 基频的相关研究  42-43
    4.5.2 声调的识别  43-45
    4.5.3 基频的估计  45-47
  4.6 其他参数的修正  47-48
  4.7 耳语音转换为正常音仿真实验及讨论  48-51
第五章总结和展望  51-53
  5.1 总结  51
  5.2 展望  51-53
参考文献  53-57
致谢  57-58
在读期间发表的学术论文  58

汉语耳语音重建的研究

内容摘要

全文目录

相似论文