学位论文 > 优秀研究生学位论文题录展示

语音信号处理技术研究

作 者: 王京辉
导 师: 宋刚;包建平
学 校: 山东大学
专 业: 电子与通信工程
关键词: 语音信号 时长规整 基音检测 共振峰调整 频谱倾斜补偿
分类号: TN912.3
类 型: 硕士论文
年 份: 2008年
下 载: 685次
引 用: 5次
阅 读: 论文下载
 

内容摘要


语音信号处理技术是语音处理领域中新近发展起来的一个学科分支,本文主要研究了语音信号处理技术中的两个主要内容:语音时长规整技术和说话人特征改变技术。语音时长规整技术就是在不改变语音音调并保证良好音质的前提下,随意地改变语音播放速度,就仿佛说话人自己在改变说话速度一样。说话人特征改变技术是语音处理中一个比较新的交叉边缘分支,主要是通过对合成语音进行适当语音参数控制和调整来实现的。针对语音时长规整技术,研究了固定同步重叠叠加(SOLAFS)算法中合成相邻帧间距ss和搜索总长度kmax的最佳参数选取,实验表明ss的取值在不小于一个平均基音周期的同时不大于帧长与一个平均基音周期的差值;kmax的取值约为一个平均基音周期。在此基础上得出了人耳对基音同步的感知存在一定的容差从而改进了二次谱提取基频算法,提高了基频提取的准确度,进一步提出了一种新的基于改进二次谱的语音时长规整算法,与SOLAFS算法相比,该算法在保持规整后语音质量的同时,有效降低了整体计算复杂度。针对说话人特征改变技术,提出了一种基于重采样的基频改变算法,该算法简单有效,整体计算复杂度较低;提出了一种非等比例调整前三个共振峰的方法,独立调整前三个共振峰的同时保证了信号总能量不变;提出了一种男女声频谱倾斜差异补偿方法,提高了男声变女声时输出语音的自然度。融合所研究的各种特征参数改变方法,构建了基于倒谱的说话人特征改变系统。最后采用混合编程方式,实现了集语音时长规整技术和说话人特征改变技术于一体的语音信号处理软件。本软件采用VC++和Matlab混合编程的思想,利用该软件,可以实现对输入语音进行变速和变声处理两个功能。在变声处理中,可以实现男声、女声、童声和老人声等之间的快速转换,也可以手动设置特征参数,进行其他要求的语音特征改变,如同性别之间的语音特征改变等。除此之外,还可以实现现场变速变声等其他功能。

全文目录


摘要  8-10
ABSTRACT  10-12
第一章 引言  12-18
  1.1 研究背景及选题意义  12-14
  1.2 国内外研究动态  14-16
    1.2.1 语音时长规整技术研究动态  14-15
    1.2.2 说话人特征改变技术研究动态  15-16
  1.3 论文研究的主要内容  16-17
  1.4 论文结构安排  17-18
第二章 语音时长规整技术研究与实现  18-36
  2.1 语音信号处理基础理论  18-23
    2.1.1 语音信号的基本特性  18-20
    2.1.2 语音信号的预处理  20-21
    2.1.3 语音音质评价方法  21-23
  2.2 时域法原理及仿真实现  23-27
    2.2.1 重叠叠加算法  23-26
    2.2.2 固定同步重叠叠加算法  26-27
  2.3 SOLAFS算法参数选取研究  27-31
    2.3.1 合成后相邻帧间距s_s的选取  28-30
    2.3.2 搜索总长度k_(max)的选取  30-31
  2.4 人耳对基音同步的感知问题  31
  2.5 改进的二次谱基频提取算法  31-33
  2.6 基于改进二次谱提取基频的时长规整算法  33-34
  2.7 本章小结  34-36
第三章 说话人特征改变技术研究与实现  36-59
  3.1 语音信号处理基础理论  36-39
    3.1.1 语音信号的发生机理和产生模型  36-37
    3.1.2 语音信号的基本分析方法  37-38
    3.1.3 语音音质评价方法  38-39
  3.2 一种基于重采样的基频改变算法  39-45
    3.2.1 算法原理  40-42
    3.2.2 仿真实验  42-45
  3.3 基于谱包络估计的共振峰提取  45-48
    3.3.1 LPC提取谱包络原理  45
    3.3.2 倒谱提取谱包络原理  45-47
    3.3.3 仿真实验  47-48
  3.4 基于谱包络压扩的共振峰改变  48-51
    3.4.1 等比例压扩谱包络  48-50
    3.4.2 分段等比例压扩谱包络  50-51
  3.5 一种男女声频谱倾斜差异补偿方法  51-53
    3.5.1 算法原理  51-52
    3.5.2 仿真实验  52-53
  3.6 基于倒谱的说话人特征改变系统  53-58
    3.6.1 LPC模型分析  53
    3.6.2 系统框图  53-56
    3.6.3 实现步骤  56
    3.6.4 仿真实验  56-58
  3.7 本章小结  58-59
第四章 语音信号改变软件的实现  59-62
  4.1 总体设计方案  59-60
  4.2 实现方法  60-61
  4.3 本章小结  61-62
第五章 总结和展望  62-64
  5.1 全文工作总结  62-63
  5.2 未来研究展望  63-64
致谢  64-65
参考文献  65-68
学位论文评阅及答辩情况表  68

相似论文

  1. 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
  2. 基于压缩感知的语音稀疏基和投影矩阵构造技术的研究,TN919.8
  3. 基于稀疏表示的语音信号的最佳投影与其重构技术的研究,TN912.3
  4. 基于改进MFCC的语音识别系统研究及设计,TN912.34
  5. 语音信号基音周期检测算法研究,TN912.3
  6. 说话人识别中特征参数的提取及优化研究,TN912.34
  7. 语音情感识别研究,TN912.34
  8. G.729语音编解码算法的研究及其DSP实现,TN919.81
  9. 钢琴校音计算机软件的设计,TP368.1
  10. 非平稳语音特征参数估计,TN912.3
  11. 藏语拉萨话新闻体韵律模型研究,TN912.3
  12. 噪声环境下说话人特征参数提取研究,TN912.3
  13. 一种用于语音信号处理的12位Sigma-Delta调制器的设计,TN761
  14. 说话人识别技术的研究,TN912.34
  15. 小波包分析在语音信号去噪中的应用,TN912.3
  16. 麦克风阵列语音信号定位算法与实验研究,TN912.3
  17. 盲信号分离系统的研究与实现,TN911.7
  18. VQ与HMM联合模型语音信号的实验研究,TN912.3
  19. 一类卷积模型描述的语音信号盲分离研究,TN912.3
  20. 基于Kalman滤波去噪的语音盲分离的研究,TN912.3
  21. 基于DSP的语音信号环境噪声降噪处理技术的研究,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com