学位论文 > 优秀研究生学位论文题录展示

语音转换中音段特征的建模与转换的研究

作　者: 毕庆刚
导　师: 张玲华
学　校: 南京邮电大学
专　业: 信号与信息处理
关键词: 语音转换人工神经网络模型量子粒子群优化算法频谱包络转换基音频率转换
分类号: TN912.3
类　型: 硕士论文
年　份: 2011年
下　载: 52次
引　用: 0次
阅　读: 论文下载

内容摘要

语音转换就是将一个说话人(源说话人)语音中的个性特征信息进行转换,使之具有另一个说话人(目标说话人)的个性特征,从而使得转换后的语音听起来就像是目标说话人的声音的一种语音信号处理技术。该技术不仅具有重要的理论研究意义,而且具有良好的应用价值,它的研究及发展研究愈来愈受到国内外学者的关注。本文的主要工作和创新如下:(1)简要介绍了语音转换的一些应用价值和当前的主要经典算法,讨论了常用的语音个性特征参数,以及语音转换系统的基本原理。(2)研究了经典的基音频率转换方法,针对经典算法在不同程度上存在转换精度和合成语音质量不高的情况。本文提出基于STRAIGHT模型和BP神经网络的基音频率转换算法。客观测试和主观测试上都取得了较好的效果。(3)研究了基于神经网络的频谱包络转换方法,考虑到神经网络训练算法有很多,但大都有一定自身的缺陷,针对梯度下降法训练速度慢和易导致陷入局部最优的问题,引出了基于量子粒子群优化BP神经网络的算法,并将其算法应用到的语音谱包络转换中,由粒子群优化算法训练的BP神经网络捕获说话人的语音频谱包络映射关系,以实现不同说话人之间声音特性的转换,该方法在一定程度上提高了转换语音性能。本文在MATLAB平台上仿真,从主观和客观两个方面评价系统的性能。仿真结果表明,本文所采用的转换方法能够取得较好的效果。

全文目录

摘要  4-5
ABSTRACT  5-8
第一章绪论  8-14
  1.1 语音转换技术的概念  8
  1.2 语音转换技术的研究意义和现状  8-11
    1.2.1 语音转换技术的研究意义  8-9
    1.2.2 语音转换技术的研究现状  9-11
  1.3 目前语音转换系统有待解决的问题  11-12
  1.4 论文的组织结构安排  12-14
第二章语音转换系统相关问题介绍  14-39
  2.1 语音信号基本原理  14-17
    2.1.1 语音的生成机理  14-16
    2.1.2 语音的数学模型  16-17
  2.2 语音信号的预处理  17-20
  2.3 语音特征参数  20-22
  2.4 语音转换的系统模型  22-31
    2.4.1 语音转换系统的构成  22-23
    2.4.2 语音的分析/合成模型  23-29
    2.4.3 参数对齐方法  29-31
  2.5 语音转换经典算法  31-36
    2.5.1 矢量码书映射算法  31-32
    2.5.2 说话人插值法  32-33
    2.5.3 线性多变量回归法  33-34
    2.5.4 动态频率规整法  34-35
    2.5.5 高斯混合模型法  35-36
  2.6 语音转换的性能评价方法  36-38
    2.6.1 客观评价方法  36-37
    2.6.2 主观评价方法  37-38
  2.7 本章小结  38-39
第三章基于人工神经网络的基音频率的转换  39-51
  3.1 神经网络的基本概念  39-42
    3.1.1 神经元的数学模型  39-40
    3.1.2 网络的连接模式  40-41
    3.1.3 学习规则  41-42
  3.2 神经网络的基本模型结构  42-45
    3.2.1 BP 神经网络  42-44
    3.2.2 RBF 神经网络  44-45
  3.3 基于BP 神经网络的基音频率转换  45-47
    3.3.1 经典的基音频率建模和转换算法  45-46
    3.3.2 基于SRRIAGHT+BP 神经网络的基音频率转换算法  46-47
  3.4 实验与仿真  47-50
    3.4.1 实验条件与环境  47-48
    3.4.2 实验结果  48-50
  3.5 本章小结  50-51
第四章基于量子粒子群优化神经网络的声道谱参数转换  51-66
  4.1 引言  51
  4.2 粒子群优化算法与神经网络  51-59
    4.2.1 基本PSO 算法描述  52-53
    4.2.2 量子粒子群算法  53-56
    4.2.3 QPSO 优化神经网络  56-58
    4.2.4 量子粒子群算法与梯度下降法的性能比较  58-59
  4.3 基于QPSO 优化神经网络的声道谱参数转换算法  59-62
    4.3.1 基于人工神经网络模型的声道谱参数转换算法  59-60
    4.3.2 基于QPSO 优化BP 神经网络的声道谱特征参数转换  60-62
  4.4 实验与仿真  62-65
    4.4.1 实验条件与环境  62
    4.4.2 实验结果  62-65
  4.5 本章小结  65-66
第五章总结与展望  66-68
  5.1 本文工作总结  66
  5.2 今后研究展望  66-68
致谢  68-69
参考文献  69-73
攻读硕士学位期间发表的论文  73

语音转换中音段特征的建模与转换的研究

内容摘要

全文目录

相似论文