学位论文 > 优秀研究生学位论文题录展示

汉语语音转换系统的研究

作　者: 杨阳
导　师: 刘湘黔
学　校: 北京交通大学
专　业: 模式识别与智能系统
关键词: 语音转换 STRAIGHT分析—合成算法混合高斯模型转换算法
分类号: TP391.42
类　型: 硕士论文
年　份: 2008年
下　载: 258次
引　用: 2次
阅　读: 论文下载

内容摘要

语音转换(Voice Conversion)是指通过语音处理手段改变一个说话人(源说话人,Source Speaker)的语音个性特征,使之具有另外一个说话人(目标说话人,Target Speaker)的语音个性特征,但转换语音所包含的语意内容不变。语音转换技术涉及信号处理、语言学、声学、计算机科学等学科领域,它的深入研究势必将会对语音学其它领域的研究发展产生促进作用,同时它在电影、电视节目的配音、医疗及保密等许多方面有着广泛的应用前景。因此语音转换技术的研究具有重要的理论价值和实用价值。本文从不同说话人发声器官的差异入手,分析了说话人个性特征及其声学特征参数表示,并采用基于STRAIGHT分析—合成算法的混合高斯模型(GMM)转换算法实现了一个特定人语音转换系统,并利用该系统对影响转换性能的因素做了相关实验和分析。论文完成的主要工作有:1.分析了说话人个性信息的声学表征问题。本文主要研究了不同说话人在以声门波形参数为代表的声源特征,以及以共振峰为代表的声道特征的差异性,选取基频参数,基频范围和线谱对系数(LSF)作为转换特征参数。2.实现了基于STRAIGHT分析—合成算法和GMM转换算法的特定人语音转换系统。为了评测GMM转换算法,进行了客观和主观评测实验,指出了GMM转换算法的过平滑现象使得转换语音音质下降的问题。3.讨论了男女语音在声源特性和声道特性的不同,搭建了一个简单的男女语音转换系统。针对男女语音在声源特性和声道特性的不同,用基频线性调整和频谱线性插值的方法实现了男女声之间地转换。非正式听辨实验证明:该转换系统实现的女声到男声的转换效果要好于男声到女声的转换效果。实现了一个变声器应用软件,该系统可以通过改变声音的基频参数,频谱参数和时长参数,来改变音质。4.分析和讨论了训练语料类型、训练数据量、混合高斯混合度、说话人差异等影响语音转换系统性能的因素,并分别进行实验。实验结论为:①联合概率密度的方法同时观察源说话人和目标说话人的参数,比只观察源说话人的参数训练的GMM模型的分类效果要好,得到的转换语音带有更多的目标说话人特征。②当训练阶段使用单音节语料时,转换单音节的准确度比转换句子的准确度要高;当训练阶段使用句子语料时,转换句子的准确度比转换单音节的准确度要高。③只有当训练数据集增大,混合度数也随之增大时,转换效果变好。④特定女性到特定男性的声音转换效果要好于特定男性到特定女性的声音转换效果;特定女性之间的声音转换效果要好于特定男性之间的声音转换效果。

全文目录

致谢  5-6
摘要  6-8
ABSTRACT  8-10
序  10-13
1 绪论  13-22
  1.1 语音转换的研究背景及选题意义  13-16
  1.2 语音转换的国内外研究动态  16-18
  1.3 语音转换研究的关键问题  18-20
  1.4 本文的主要工作  20-21
  1.5 论文的结构安排  21-22
2 语音转换的基本原理  22-34
  2.1 引言  22
  2.2 语音基本知识  22-26
    2.2.1 语音的产生机理  22
    2.2.2 语音产生模型  22-24
    2.2.3 语音信号的特征分析  24-26
  2.3 说话人个性特征及其声学特征参数表示  26-30
    2.3.1 喉部生理差异及个性特征在声源上的表现  26-27
    2.3.2 声道生理差异及个性特征在声道上的表现  27-28
    2.3.3 声学特征参数  28-30
  2.4 语音转换系统的结构和组成  30-32
    2.4.1 语音转换系统的基本构架  30-31
    2.4.2 语音转换方法概述  31
    2.4.3 语音库的建立  31-32
  2.5 语音转换系统的评价标准  32-34
    2.5.1 客观评价标准  32-33
    2.5.2 主观评价标准  33-34
3 基于STRAIGHT和GMM的语音转换系统的原理和实现  34-62
  3.1 语音信号的预处理  34-37
  3.2 STRAIGHT分析—合成算法  37-45
    3.2.1 去除周期性影响的谱估计  37-41
    3.2.2 平滑可靠的基频轨迹的提取  41-42
    3.2.3 语音的重构  42-44
    3.2.4 实验结果  44-45
  3.3 转换函数的建立  45-55
    3.3.1 语音信号的时间对齐  45-47
    3.3.2 频谱转换算法概述  47
    3.3.3 基于混合高斯模型(GMM)频谱转换算法的原理和实现  47-53
    3.3.4 基频转换算法概述  53
    3.3.5 基频转换算法的原理和实现  53-55
  3.4 转换语音的合成  55-57
  3.5 男声和女声之间的语音转换  57-59
    3.5.1 男女语音转换的依据  57
    3.5.2 频谱搬移  57-58
    3.5.3 实验结果  58-59
  3.6 变声器的设计与实现  59-62
    3.6.1 变声器图形用户界面的设计  59
    3.6.2 变声器图形用户界面的实现  59-62
4 实验与结果讨论  62-67
  4.1 实验条件  62-63
  4.2 联合特征矢量法对转换性能的影响  63-64
  4.3 训练语料的类型对转换性能的影响  64
  4.4 训练语音集大小和GMM的混合度对转换性能的影响  64-65
  4.5 说话人差异对转换性能的影响  65-66
  4.6 结果讨论  66-67
5 结论与展望  67-69
参考文献  69-72
作者简历  72-74
学位论文数据集  74

汉语语音转换系统的研究

内容摘要

全文目录

相似论文