学位论文 > 优秀研究生学位论文题录展示

语音特征提取及在音色转换系统的应用

作 者: 虞国桥
导 师: 梁满贵
学 校: 北京交通大学
专 业: 信号与信息处理
关键词: 音色转换 二维精细谱 动态特征参数
分类号: TN912.3
类 型: 硕士论文
年 份: 2006年
下 载: 354次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着信息技术与计算机技术的迅速发展,计算机应用深入到我们生活、工作的方方面面,人与计算机的联系越来越密切,人机交互研究,特别是语音方式的人机交互研究越来越广泛受到关注。人们不满于键盘鼠标的人机交互方式,希望使用更方便的图象语音,并且有个性化的特征。语音转换技术就是这样一种技术,它使语音形式的人机交互个性化,具有重要的理论和应用意义,是本论文的主要研究对象。音色转换(Voice Conversion)是一项改变说话人声音特征的技术即转换说话人的音色个性特征而保持说话内容不变,在语音即时聊天,电影、广播、电视中剪辑和配音,语音合成的语料库收集,语音合成后端语音的个性化处理,在情报部门等都有很多应用。音色转换主要转换说话人的特征,本文着眼点是在高质量STRAIGHT语音分析合成下语音特征参数提取的研究。本文主要完成了以下几方面的工作:(1)了解音色转换的研究现状,熟悉各种音色转换方法的基础上,对其进行了优劣的比较的研究。(2)在STRAIGHT分析算法的基础上采用动态特征参数,优化对特征参数的提取,提高了声音转换的质量。

全文目录


中文摘要  6-7
ABSTRACT  7-8
序  8-11
1 综述  11-18
  1.1 选题背景及意义  11-16
    1.1.1 选题背景  11-14
    1.1.2 系统的应用  14-16
  1.2 主要工作  16-17
  1.3 论文的内容安排  17-18
2 系统结构与设计  18-31
  2.1 系统介绍  18
  2.2 音色转换系统结构  18-19
  2.3 涉及的关键技术  19-30
    2.3.1 分析合成  20-22
    2.3.2 特征参数  22-23
    2.3.3 映射规则  23-29
    2.3.4 系统评测  29-30
  2.4 小结  30-31
3 特征参数提取方法介绍  31-39
  3.1 语音特征参数  31-37
    3.1.1 基音周期  32-34
    3.1.2 线性预测倒谱系数  34
    3.1.3 美尔频标倒谱系数  34-35
    3.1.4 感觉加权的线性预测特征  35-37
    3.1.5 其它一些特征参数  37
  3.2 特征参数的优化  37-38
    3.2.1 各种特征参数的比较  37
    3.2.2 混合特征参数  37-38
  3.3 小结  38-39
4 系统的设计与实现  39-51
  4.1 数字化与预处理  39-40
    4.1.1 数字化  39
    4.1.2 预处理  39-40
  4.2 信号分析  40-42
  4.3 参数提取过程  42-47
  4.4 训练与转换过程  47-49
  4.5 一些实验数据的分析  49-51
    4.5.1 实验数据及系统平台  49
    4.5.2 实验分析  49-51
5 结论  51-52
参考文献  52-55
附录 A  55-62
作者简历  62-64
学位论文数据集  64

相似论文

  1. 藏语安多话音色转换技术研究及其实现,TN912.34
  2. 基于统计特性的汉语方言辨识方法研究,TP391.42
  3. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  4. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  5. 基于DSP的机器人语音命令识别系统研制,TN912.34
  6. 音乐结构自动分析研究,TN912.3
  7. 网络语音传输丢包的恢复技术,TN912.3
  8. 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
  9. 基于多重分形的语音情感识别研究,TN912.34
  10. 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
  11. iLBC语音编码技术的研究及DSP的设计与优化,TN912.3
  12. 数字音频真实性检测方法的研究与实现,TN912.3
  13. 声道频响合成方法在军队姓名语音库的应用,TN912.3
  14. 数字助听器中汉语语音处理及语音增强的研究,TN912.3
  15. 基于语音生成和获取中声音分类学习的神经模型研究,TN912.3
  16. 高质量语音转换系统中关键技术的研究,TN912.3
  17. 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
  18. 基于压缩感知的语音信号编码技术研究,TN912.3
  19. 基于DIVA模型语音生成与获取的扰动研究,TN912.3
  20. 基于稀疏表示的语音信号的最佳投影与其重构技术的研究,TN912.3
  21. 数字助听器中语音增强技术的研究,TN912.35

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com