学位论文 > 优秀研究生学位论文题录展示
移动便携平台语音韵律转换技术研究
作 者: 戎建业
导 师: 马鸿飞
学 校: 西安电子科技大学
专 业: 通信与信息系统
关键词: 韵律转换 基音检测 基音标注 线性预测
分类号: TN912.3
类 型: 硕士论文
年 份: 2008年
下 载: 34次
引 用: 0次
阅 读: 论文下载
内容摘要
语音韵律转换技术是指在保持语音信号谱包络不变的条件下单独改变语音的基频或时长。这种技术是语音信号处理中的一个较新的分支,它具有很重要的理论意义和实用价值。本文研究的目的是开发一种能够在移动便携平台上进行实时处理的高质量、高自然度语音韵律转换系统。文章首先介绍了几种典型的语音韵律转换方法,接下来着重研究了一种低复杂度的韵律转换算法——TD-PSOLA算法。其中,对该算法中的关键技术点如基音检测、基音标注和同步叠加合成等进行了详细研究,将矩阵最优路径算法应用于本系统,并且讨论了叠加窗长度的选择对信号合成造成的影响,发现选择韵律转换前后对应较小的基音周期的窗长能够有效减少合成信号中的噪声。此外,根据TD-PSOLA算法直接对信号波形进行复制或删除,在修改基频时很容易造成信号幅度、相位及语谱上的不连续而造成合成信号质量下降这一缺点,提出将线性预测应用于本系统。实验表明,引入线性预测能够很好的改善合成语音的质量,同时系统的运算复杂度依然保持在一个较低的水平。文章最后介绍了一种新的基于HNM模型的韵律转换技术。经HNM模型处理后生成的信号质量要好于基于TD-PSOLA算法得到的结果,但对目前的硬件条件而言,这种基于HNM模型的韵律转换算法的复杂度还是很高,不适合于在移动便携平台上进行实时处理。
|
全文目录
摘要 3-4 ABSTRACT 4-7 第一章 绪论 7-9 1.1 引言 7 1.2 语音韵律转换技术 7-8 1.3 本文的主要工作和主要成果 8-9 第二章 语音韵律转换技术概述 9-13 2.1 引言 9 2.2 语音韵律转换技术的提出 9-10 2.3 现代语音韵律转换技术 10-13 2.3.1 参数合成技术 10-11 2.3.2 波形拼接技术 11 2.3.3 混合技术 11 2.3.4 几种典型方法介绍 11-13 第三章 语音信号数字处理基础 13-21 3.1 引言 13 3.2 语音的产生原理与基本特征 13-15 3.2.1 语音产生机理 13-14 3.2.2 语音个性特征参数 14-15 3.3 汉语语音的特性 15-18 3.3.1 音素与音节 15-16 3.3.2 基音频率与四声 16-17 3.3.3 声调的声学特征 17-18 3.4 语音信号数字处理 18-21 3.4.1 语音信号产生模型 18 3.4.2 语音信号数字处理中的短时分析技术 18-21 第四章 TD-PSOLA 算法分析与研究 21-33 4.1 TD-PSOLA 算法的提出 21 4.2 TD-PSOLA 算法简述 21-25 4.2.1 基音同步分析 22 4.2.2 基音同步修改 22 4.2.3 基音同步叠加合成 22-23 4.2.4 时长的修改 23-24 4.2.5 基频的修改 24-25 4.3 TD-PSOLA 算法研究 25-29 4.3.1 短时傅立叶变换 25-26 4.3.2 谱相等意义下的TD-PSOLA 公式推导 26-27 4.3.3 最小均方差意义下的TD-PSOLA 公式推导 27-28 4.3.4 最小均方意义下基音同步叠加合成公式的简化 28-29 4.4 TD-PSOLA 频域分析 29-31 4.5 本章小结 31-33 第五章 TD-PSOLA 算法的实现与改进 33-53 5.1 TD-PSOLA 算法方案 33 5.2 清浊判别 33-34 5.3 基音检测 34-38 5.3.1 基于短时自相关函数的基音检测 35-37 5.3.2 基频轨迹的平滑 37-38 5.4 基音标注 38-43 5.4.1 利用峰值之间的距离与基音周期的关系 39-40 5.4.2 利用累积概率最大化和动态规划 40-41 5.4.3 矩阵最优路径算法 41-43 5.5 短时语音信号分析 43-46 5.6 短时语音信号的修改与合成 46-47 5.7 实验结果及分析 47-48 5.8 基于线性预测的TD-PSOLA 算法 48-52 5.8.1 线性预测 48-49 5.8.2 线性预测系数的求解方法 49-51 5.8.3 实验结果及分析 51-52 5.9 本章小结 52-53 第六章 HNM 合成算法 53-59 6.1 引言 53-54 6.2 HNM 模型的表述 54 6.3 HNM 的参数分析 54-56 6.4 HNM 模型韵律修改及语音合成 56 6.5 本章小结 56-59 结束语 59-60 致谢 60-61 参考文献 61-64 研究成果 64-65
|
相似论文
- 网络语音传输丢包的恢复技术,TN912.3
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 基于神经网络建模的聚丙烯牌号切换非线性预测控制,TQ325.14
- 语音信号基音周期检测算法研究,TN912.3
- 说话人识别中特征参数的提取及优化研究,TN912.34
- 卫星姿态确定的非线性滤波方法研究,V448.2
- 钢琴校音计算机软件的设计,TP368.1
- 噪声环境下说话人特征参数提取研究,TN912.3
- 捷联系统的冗余配置与故障管理方案研究,V241.5
- 基于声音样本匹配的语音应用系统技术研究,TP391.42
- 基音检测算法研究及其在方言辨识中的应用,TP391.42
- 西安方言的声学特征分析和韵律建模的研究,TN912.3
- 基于基音检测的单声道混合语音信号盲分离算法研究,TN912.3
- 钢琴调音软件的设计,TN912.3
- Hilbert-Huang变换及其在语音特征提取中的应用,TN912.3
- 语音信号处理技术研究,TN912.3
- 汉语普通话基频模式研究,TN912.33
- 基于WI的低速率语音编码算法研究与实现,TN912.3
- 小波分析在语音信号基音检测中的应用研究,TN912.3
- 低码率正弦变换编码研究,TN911.22
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|