学位论文 > 优秀研究生学位论文题录展示
语音合成自然度的研究
作 者: 吕鹏
导 师: 刘齐跃
学 校: 河北科技大学
专 业: 通信与信息系统
关键词: 语音合成 自然度 PSOLA算法 清浊音的判断 短时自相关函数
分类号: TN912.33
类 型: 硕士论文
年 份: 2010年
下 载: 118次
引 用: 2次
阅 读: 论文下载
内容摘要
随着社会的不断进步,人们在关于语音处理方面的研究已经取得了很多研究成果,尤其是语音合成的可懂度已经达到了相当高的要求,但是在语音自然度方面仍然与人们的预期要求有一定的差距,这将严重影响语音合成技术的进一步发展。本文主要研究在语音合成的基础上,针对现在的语音合成自然度不高的问题提出的改进方法,主要过程为以自我录制的语音库的语音合成为例,利用波形拼接的方法对语音自然度进行改进,并通过主客观评测方式验证语音自然度的改进效果。主要内容如下:1)从语音学的基本要素出发,分析语音合成的基本要素,研究一些影响语音合成自然度的相关问题,并从中分析出语音合成与语音识别等的关系。2)以音节为单位制作语音库,并通过对语音的无声段处理,消除掉影响语音信号连接的停顿较长的问题,并分析出合成语音时不必要的部分,运用波形拼接算法中的TD-PSOLA和FD-PSOLA方法分别对语音的时长和频率进行调整,使其在韵律控制上更加贴近自然发音,同时利用语音韵律参数声音及图像的对比来看出语音合成前后及与自然音之间的差距,进而分析出语音自然度的改进程度。3)最后本文对语音合成自然度的系统进行了仿真实验,经系统仿真后在语音的自然度上有了一定的提高,并利用主客观的方法对合成结果进行了评测,效果非常理想。本文的研究为语音合成自然度的进一步研究提供了很好的基础和方案。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第1章 绪论 9-15 1.1 课题的研究背景及意义 9-10 1.2 语音合成的发展进程 10-12 1.3 语音合成的应用 12 1.4 语音合成中遇到的难题 12-13 1.5 课题的研究方案的确定 13-15 第2章 研究方法的确定及语音库的改进 15-20 2.1 语音合成的基本理论讨论 17-18 2.2 语音库语料的选择及改进 18-19 2.2.1 语音库语料的选择 18-19 2.2.2 语音库的改进方案 19 2.3 本章小结 19-20 第3章 语音自然度的参数分析 20-37 3.1 语音质量的评价方式 20 3.2 影响语音自然度的几个方面 20 3.3 语音自然度的提高方法 20-21 3.4 汉语语音的韵律分析 21-31 3.4.1 韵律模型 21-23 3.4.2 汉语语音韵律特性 23-24 3.4.3 语谱图 24-25 3.4.4 韵律参数分析 25-29 3.4.5 运用韵律的语料库标注 29-31 3.5 语音短时分析技术 31-36 3.5.1 短时能量 31-32 3.5.2 短时平均幅度 32-33 3.5.3 短时平均过零率 33-34 3.5.4 短时自相关函数 34-36 3.6 本章小结 36-37 第4章 端点检测 37-44 4.1 语音信号的预处理 37 4.2 声音切分 37-40 4.3 端点检测在本文中的应用 40-42 4.4 改进后的效果 42-43 4.5 本章小结 43-44 第5章 基音同步叠加(PSOLA)语音合成方法 44-53 5.1 波形合成需要解决的问题 44 5.2 PSOLA 的算法原理 44-46 5.3 TD-PSOLA 算法 46-51 5.3.1 语音切分 47 5.3.2 语音标注 47-48 5.3.3 函数加权 48 5.3.4 标注合成 48-49 5.3.5 合成语音信号 49 5.3.6 不完整帧的修改 49-50 5.3.7 结果分析 50-51 5.4 PD-PSOLA 算法 51-52 5.5 本章小结 52-53 第6章 语音合成仿真测试 53-68 6.1 实现方案 53 6.2 语音合成仿真前后结果对比 53-61 6.3 系统界面的介绍 61-63 6.4 语音评测标准 63-66 6.4.1 客观评测标准 64 6.4.2 主观测评分析 64-66 6.5 改进方案讨论 66-67 6.6 本章小结 67-68 结论 68-70 参考文献 70-73 攻读学位期间所发表的学术论文 73-74 致谢 74
|
相似论文
- 声道频响合成方法在军队姓名语音库的应用,TN912.3
- 移动音视频交互业务执行平台的研究,TN915.09
- 仿真机器人控制系统,TP242
- 基于自动切分的PSOLA语音合成在大坝监控系统中的应用研究,TP277
- Ant在IVR系统测试的应用,TP311.52
- 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
- 语音库自动构建技术的研究,TN912.33
- 基于多层架构模型设计的呼叫中心设计及实现,TN99
- 天然小叶青冈林空间分布格局及结构特征评价,S718.5
- 基于HMM的可训练越南语语音合成系统,TN912.33
- 语音变调算法研究及其在语音合成中的应用,TN912.33
- 基于嵌入式技术的射频识别信息终端研究开发,TP368.12
- 基于GSM网络具有语音合成功能系统的设计与实现,TN912.33
- 基于G.729标准的拼音合成算法及其DSP实现,TN912.3
- 基于移动终端的旅游信息推送服务系统关键技术研究,TN929.53
- 济南市南部山区风景旅游区景观生态评价及对策研究,Q149
- 跨文化的情感语音分析,TP391.42
- 基于情感基音模板的情感语音合成,TN912.33
- 面向气象语音呼叫中心的语音合成软件设计与实现,TN912.33
- 泰山罗汉崖林场森林近自然结构与水土保持功能,S714.7
- 虚拟替身自主交互模型研究,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音合成
© 2012 www.xueweilunwen.com
|