学位论文 > 优秀研究生学位论文题录展示
语音转换中音段特征的建模与转换的研究
作 者: 毕庆刚
导 师: 张玲华
学 校: 南京邮电大学
专 业: 信号与信息处理
关键词: 语音转换 人工神经网络模型 量子粒子群优化算法 频谱包络转换 基音频率转换
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 52次
引 用: 0次
阅 读: 论文下载
内容摘要
语音转换就是将一个说话人(源说话人)语音中的个性特征信息进行转换,使之具有另一个说话人(目标说话人)的个性特征,从而使得转换后的语音听起来就像是目标说话人的声音的一种语音信号处理技术。该技术不仅具有重要的理论研究意义,而且具有良好的应用价值,它的研究及发展研究愈来愈受到国内外学者的关注。本文的主要工作和创新如下:(1)简要介绍了语音转换的一些应用价值和当前的主要经典算法,讨论了常用的语音个性特征参数,以及语音转换系统的基本原理。(2)研究了经典的基音频率转换方法,针对经典算法在不同程度上存在转换精度和合成语音质量不高的情况。本文提出基于STRAIGHT模型和BP神经网络的基音频率转换算法。客观测试和主观测试上都取得了较好的效果。(3)研究了基于神经网络的频谱包络转换方法,考虑到神经网络训练算法有很多,但大都有一定自身的缺陷,针对梯度下降法训练速度慢和易导致陷入局部最优的问题,引出了基于量子粒子群优化BP神经网络的算法,并将其算法应用到的语音谱包络转换中,由粒子群优化算法训练的BP神经网络捕获说话人的语音频谱包络映射关系,以实现不同说话人之间声音特性的转换,该方法在一定程度上提高了转换语音性能。本文在MATLAB平台上仿真,从主观和客观两个方面评价系统的性能。仿真结果表明,本文所采用的转换方法能够取得较好的效果。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第一章 绪论 8-14 1.1 语音转换技术的概念 8 1.2 语音转换技术的研究意义和现状 8-11 1.2.1 语音转换技术的研究意义 8-9 1.2.2 语音转换技术的研究现状 9-11 1.3 目前语音转换系统有待解决的问题 11-12 1.4 论文的组织结构安排 12-14 第二章 语音转换系统相关问题介绍 14-39 2.1 语音信号基本原理 14-17 2.1.1 语音的生成机理 14-16 2.1.2 语音的数学模型 16-17 2.2 语音信号的预处理 17-20 2.3 语音特征参数 20-22 2.4 语音转换的系统模型 22-31 2.4.1 语音转换系统的构成 22-23 2.4.2 语音的分析/合成模型 23-29 2.4.3 参数对齐方法 29-31 2.5 语音转换经典算法 31-36 2.5.1 矢量码书映射算法 31-32 2.5.2 说话人插值法 32-33 2.5.3 线性多变量回归法 33-34 2.5.4 动态频率规整法 34-35 2.5.5 高斯混合模型法 35-36 2.6 语音转换的性能评价方法 36-38 2.6.1 客观评价方法 36-37 2.6.2 主观评价方法 37-38 2.7 本章小结 38-39 第三章 基于人工神经网络的基音频率的转换 39-51 3.1 神经网络的基本概念 39-42 3.1.1 神经元的数学模型 39-40 3.1.2 网络的连接模式 40-41 3.1.3 学习规则 41-42 3.2 神经网络的基本模型结构 42-45 3.2.1 BP 神经网络 42-44 3.2.2 RBF 神经网络 44-45 3.3 基于BP 神经网络的基音频率转换 45-47 3.3.1 经典的基音频率建模和转换算法 45-46 3.3.2 基于SRRIAGHT+BP 神经网络的基音频率转换算法 46-47 3.4 实验与仿真 47-50 3.4.1 实验条件与环境 47-48 3.4.2 实验结果 48-50 3.5 本章小结 50-51 第四章 基于量子粒子群优化神经网络的声道谱参数转换 51-66 4.1 引言 51 4.2 粒子群优化算法与神经网络 51-59 4.2.1 基本PSO 算法描述 52-53 4.2.2 量子粒子群算法 53-56 4.2.3 QPSO 优化神经网络 56-58 4.2.4 量子粒子群算法与梯度下降法的性能比较 58-59 4.3 基于QPSO 优化神经网络的声道谱参数转换算法 59-62 4.3.1 基于人工神经网络模型的声道谱参数转换算法 59-60 4.3.2 基于QPSO 优化BP 神经网络的声道谱特征参数转换 60-62 4.4 实验与仿真 62-65 4.4.1 实验条件与环境 62 4.4.2 实验结果 62-65 4.5 本章小结 65-66 第五章 总结与展望 66-68 5.1 本文工作总结 66 5.2 今后研究展望 66-68 致谢 68-69 参考文献 69-73 攻读硕士学位期间发表的论文 73
|
相似论文
- 高质量语音转换系统中关键技术的研究,TN912.3
- 电磁装置优化设计的应用研究,TM503.1
- 基于BP人工神经网络的多点非时序变形预测模型研究,P258
- 基于人工神经网络模型的说话人转换算法研究,TN912.34
- 基于高斯混合模型的语音转换技术研究,TN912.3
- 基于分类映射的非并行语料语音转换,TN912.3
- 基于LPAC-PSOLA合成算法语音转换系统,TN912.3
- 一种智能变换语音技术的研究,TN912.3
- 新安煤田二_1煤层煤与瓦斯突出危险程度预测,TD713
- 基于ANN的毛白杨农田防护林林分密度指数建模,S727.24
- 基于VQ模型和BP网络的高自然度语音转换,TN912.3
- 基于RBF神经网络的汉语耳语音转换为正常语音的研究,TN912.3
- 特定对象汉语语音转换系统的研究,TN912.32
- 小麦黄矮病人工神经网络模型及苹果褐斑病动态预测模型的构建,S436.611
- 前向神经网络在攀钢焦油生产控制系统中的应用,TP273.5
- 地区宏观经济预测中的人工神经网络模型与方法研究,F224.33
- 基于组件技术的多媒体应用系统开发技术研究,TP311.52
- UMS中的TTS/ASR技术研究,TP311.52
- 项目风险分析的人工神经网络理论模型及应用研究,F224
- 城市一般建筑物快速震害预测方法的研究,TU352.11
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|