学位论文 > 优秀研究生学位论文题录展示
汉语耳语音重建的研究
作 者: 黄程
导 师: 陶亮
学 校: 安徽大学
专 业: 计算机应用技术
关键词: 混合激励线性预测模型 端点检测 声韵分割 共振峰修正 基频添加 连续耳语音重建
分类号: TN912.3
类 型: 硕士论文
年 份: 2013年
下 载: 7次
引 用: 0次
阅 读: 论文下载
内容摘要
耳语音是人与人之间一种特殊的语音交流方式。其具有声带不振动、基频缺失和声音能量低的特性,这些特性降低了耳语音的可懂度和清晰度。耳语音向正常音的转换重建具有重要的理论意义和应用价值。本文基于混合激励线性预测模型,研究了连续汉语耳语音合成重建正常语音的相关技术,主要工作包括:建立了基于混合激励线性预测(MELP)模型的连续汉语耳语音向正常音的转换模型。对耳语音和相应正常语音的混合激励线性预测(MELP)模型的编码参数进行了比较分析。提出了基于Gabor变换的时频域信息熵和过零率的端点检测方法。首先利用信息熵来区分语音的有声段和无声段。其次针对连续耳语音中利用信息熵的端点检测存在着耳语音的语音段误判为无声段这一缺点,利用过零率方法对端点检测的熵值相近熵阈值的语音帧进行修正。提出了基于Gabor时频域对称相对熵的声韵分割方法。在声韵分割中,利用声母和韵母的能量聚集性、共振峰结构以及频谱差异,采用对称相对熵值来分割声母和韵母。实现了基于线谱对(LSP)的共振峰修正,对共振峰的峰值位置和带宽进行修改。在对耳语音中的韵母部分添加基频时,首先基于Bark频带域的功率谱和声调的关系,来判别语音的声调的类型,进而对耳语音声调进行识别,然后利用五度字调模型对语音帧添加基频信息。最后利用修正后的参数实现了基于MELP模型的耳语音向正常音的重建。实验结果表明,该方法能重建较为自然流畅的正常音。
|
全文目录
摘要 3-4 Abstract 4-5 目录 5-7 第一章 绪论 7-10 1.1 背景及意义 7-8 1.2 耳语音重建研究的概况 8-9 1.3 研究内容、目标以及解决的问题 9 1.4 论文内容与安排 9-10 第二章 混合激励线性预测模型 10-22 2.1 概述 10-11 2.1.1 MELP声码器的基本原理 10 2.1.2 MELP声码器模型的概述 10-11 2.2 MELP编码器算法 11-16 2.2.1 基音提取 11-13 2.2.2 子带语音分析 13-14 2.2.3 线性预测分析 14 2.2.4 增益估计 14-15 2.2.5 傅里叶级数幅值的计算和量化 15-16 2.3 MELP解码器算法 16-21 2.3.1 噪声抑制 16-17 2.3.2 参数插值 17-18 2.3.3 混合激励的产生 18-19 2.3.4 自适应谱增强 19-20 2.3.5 线性预测合成 20 2.3.6 增益调整 20 2.3.7 脉冲整形 20-21 2.4 MELP声码器的合成结果 21-22 第三章 MELP模型中耳语音和正常音的参数差异分析 22-30 3.1 引言 22-23 3.2 基音周期 23-26 3.2.1 基音周期的定义 23 3.2.2 基频检测 23-25 3.2.3 耳语音和正常语音的基音周期 25-26 3.3 语音共振峰 26-27 3.3.1 共振峰的定义 26 3.3.2 共振峰的估计 26-27 3.3.3 耳语音和正常语音的共振峰 27 3.4 其它参数 27-28 3.4.1 抖动系数 27-28 3.4.2 增益 28 3.5 基于MELP的耳语音重建模型 28-30 第四章 基于MELP模型的耳语音重建 30-51 4.1 引言 30 4.2 耳语音的端点检测 30-36 4.2.1 基于Gabor变换的时频域的端点检测 30-32 4.2.2 耳语音的端点检测修正 32 4.2.3 耳语音端点检测的实验结果 32-34 4.2.4 基于过零率的耳语音端点检测修正 34-36 4.3 耳语音的声韵分割 36-38 4.3.1 耳语音的声韵分割 36-37 4.3.2 连续耳语音的声韵分割 37 4.3.3 耳语音声韵分割的结果 37-38 4.4 共振峰的修正 38-42 4.4.1 线性谱域的共振峰修正 38-42 4.4.2 共振峰修正的结果 42 4.5 添加基频 42-47 4.5.1 基频的相关研究 42-43 4.5.2 声调的识别 43-45 4.5.3 基频的估计 45-47 4.6 其他参数的修正 47-48 4.7 耳语音转换为正常音仿真实验及讨论 48-51 第五章 总结和展望 51-53 5.1 总结 51 5.2 展望 51-53 参考文献 53-57 致谢 57-58 在读期间发表的学术论文 58
|
相似论文
- 车载多媒体语音识别系统设计,TN912.34
- 数字助听器中语音增强技术的研究,TN912.35
- 功率谱估计在宽带ADCP信号检测中的研究与应用,TN911.23
- 基于扩展型双线性变换法的耳语音转换为正常语音的研究,TN912.3
- 音频生命探测仪中一些信号处理方法的研究,TN912.3
- 说话人识别中语音增强算法的研究和系统实现,TN912.3
- EOG信号的特征提取与识别算法研究,TP391.41
- 带噪环境下的汉语连续语音识别研究,TN912.34
- 基于大型医疗设备的语音指令控制系统的研究,TH77
- 孤立词语音识别系统关键问题的研究,TN912.3
- 语音增强的算法研究,TN912.35
- PSC单字、词语的计算机自动对比分析系统设计研究,H085
- 神经网络方法在语音信号检测中应用的研究,TN912.3
- 基于能量的音频流分割和多模式自动机控制系统,TP273.5
- 小型语音识别系统的研究和开发,R318.6
- 语音识别的环境噪音抑制研究,TN912.34
- 基于音频和视觉特征的语音端点检测,TN912.3
- 基于Hilbert-Huang变换的语音增强研究,TP391.42
- 语音信号动力学特性递归分析,R318
- 基于HMM和神经网络的语音识别研究,TN912.34
- 基于iOS平台的乐音识别关键技术研究与设计,TN912.34
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|