学位论文 > 优秀研究生学位论文题录展示
基于稀疏分解的单通道混合语音分离算法研究
作 者: 郭海燕
导 师: 杨震
学 校: 南京邮电大学
专 业: 信号与信息处理
关键词: 语音分离 稀疏分解 压缩感知 字典学习 线性规划
分类号: TN912.3
类 型: 博士论文
年 份: 2011年
下 载: 88次
引 用: 0次
阅 读: 论文下载
内容摘要
单通道混合语音分离是语音分离研究的重要方向,稀疏分解理论的发展为解决单通道混合语音分离问题提供了新的思路。正因为如此,本论文主要研究基于稀疏分解的单通道混合语音分离算法。借鉴稀疏分解和随之发展起来的压缩感知的理论成果,通过字典学习,构造合适的与源语音信号自适应的基或字典,在此基础上,采用l0 -范数优化算法,设计有效的基于稀疏分解的单通道混合语音分离算法和基于压缩感知的单通道混合语音分离算法,以达到增强目标语音,抑制干扰语音的目的。本论文的主要工作和创新如下:①从探讨如何构造与源语音信号自适应的基或字典出发,提出通过对角化源语音信号自相关矩阵,构造理想准KLT基,并从理论上证明,任何信号在理想准KLT基下都具有稀疏性。鉴于在实际情况下,不一定能获得确切的理想准KLT基,提出通过选取合适的模板和计算相应的模板匹配系数,来近似语音信号的自相关矩阵,再对近似的自相关矩阵进行特征值分解,构造两种实用的模板匹配准KLT基—非齐次线性均方估计模板匹配准KLT基和正交匹配追踪模板匹配准KLT基。仿真表明,浊音信号在模板匹配准KLT基下的特性与在理想准KLT基下的特性相近。②以创新点①为基础,研究基于准KLT基的单通道混合语音分离。a从理论上证明,当基函数满足一定的条件时,采用l0 -范数优化算法,可以实现单通道混合语音的完美分离,并进一步证明理想准KLT基满足该条件b由于实际语音分离时,源信号未知,故无法获得理想准KLT基,提出对上述两种模板匹配准KLT基构造方法进行改进,以混合语音信号为已知条件,来构造各源语音信号的模板匹配准KLT基。在此基础上,提出了两种实用的基于模板匹配准KLT基的单通道混合语音分离算法—基于非齐次线性均方估计模板匹配准KLT基的分离算法和基于正交匹配追踪模板匹配准KLT基的分离算法。仿真表明,该算法的性能优于现有的基于独立成分分析基的分离算法和采用形分析技术改进后的计算机场景分析算法。③论文将压缩感知和单通道混合语音分离相联系,研究基于压缩感知的单通道混合语音分离。a从压缩感知的视角看待单通道混合语音分离问题,设计基于压缩感知和K-SVD的单通道混合语音分离算法。仿真表明,该算法对各类混合语音的分离效果相差不大,性能稳定。b在DCT域设计基于能量特性的帧间帧内自适应语音压缩感知观测构造算法,以进一步减少基于压缩感知的源语音信号的“采样率”,为研究基于压缩感知观测特性的单通道混合语音分离奠定基础。仿真表明,该算法的性能优于贝叶斯压缩感知算法的性能。
|
全文目录
摘要 6-8 ABSTRACT 8-10 缩略语 10-12 图表说明 12-15 目录 15-17 第一章 绪论 17-38 1.1 单通道混合语音分离的概念及研究意义 17-19 1.2 单通道混合语音分离的研究现状 19-25 1.2.1 基于统计模型的单通道混合语音分离方法 19-21 1.2.2 计算机听觉场景分析 21-23 1.2.3 基于投影分解的单通道混合语音分离方法 23-25 1.3 基于稀疏分解的单通道混合语音分离算法现状 25-34 1.3.1 字典的构造方法 25-28 1.3.2 信号的稀疏分解 28-30 1.3.3 基于稀疏分解的单通道混合语音分离算法研究现状 30-34 1.4 课题来源及意义 34-35 1.5 论文的研究内容及成果 35-36 1.6 本文后续的安排 36-38 第二章 语音信号模板匹配准KLT 基的构造算法 38-74 2.1 理想准KLT 基的构造 38-42 2.1.1 理论分析 38-40 2.1.2 仿真结果 40 2.1.3 讨论 40-42 2.2 NLMSE 模板匹配准KLT 基的构造 42-57 2.2.1 算法原理 42-45 2.2.2 仿真结果 45-57 2.3 OMP 模板匹配准KLT 基 57-69 2.3.1 算法原理 57-60 2.3.2 仿真结果 60-69 2.4 不同基的性能比较 69-72 2.4.1 NLMSE 模板匹配准KLT 基和OMP 模板匹配准KLT 基的比较 69-70 2.4.2 DCT 基与模板匹配准KLT 基的比较 70-72 2.5 本章小结 72-74 第三章 基于准KLT 基的单通道混合语音分离 74-99 3.1 基于理想准KLT 基的单通道混合语音分离 75-81 3.1.1 理论分析 75-78 3.1.2 仿真结果 78-81 3.2 基于NLMSE 模板匹配准KLT 基的单通道混合语音分离算法 81-89 3.2.1 算法原理 81-83 3.2.2 仿真结果 83-86 3.2.3 讨论与分析 86-89 3.3 基于OMP 模板匹配准KLT 基的单通道混合语音分离 89-96 3.3.1 算法原理 89-91 3.3.2 仿真结果 91-95 3.3.3 讨论与分析 95-96 3.4 不同算法的性能比较 96-98 3.5 本章小结 98-99 第四章 基于CS 的单通道混合语音分离 99-123 4.1 CS 的基本原理 100-102 4.2 基于CS 和K-SVD 的单通道混合语音分离 102-111 4.2.1 CS 与单通道混合语音分离的联系 102-103 4.2.2 基于CS 和K-SVD 的单通道混合语音分离 103-105 4.2.3 仿真结果 105-109 4.2.4 比较与分析 109-111 4.3 基于自适应CS 观测特性的单通道混合语音分离 111-121 4.3.1 DCT 域语音信号的自适应CS 方案 111-115 4.3.2 仿真结果 115-120 4.3.3 比较与分析 120-121 4.4 本章小结 121-123 第五章 结束语 123-126 参考文献 126-138 攻读博士期间撰写的学术论文 138-139 攻读博士期间参加的科研项目 139-140 致谢 140
|
相似论文
- 肥城煤炭配送中心配煤模型研究,F259.2;F224
- 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
- 压缩感知在无线通信网络异常事件检测中的应用研究,TN929.5
- 基于随机矩阵理论和压缩感知的合作频谱感知技术研究,TN925
- 压缩感知中信号重构算法的研究,TN911.6
- 基于压缩感知的认知无线电频谱检测技术及其研究,TN925
- 压缩感知在无线传感网中的应用研究,TN929.5
- 基于稀疏分解的医学图像去噪,TP391.41
- 脑部CT图像的压缩应用,TP391.41
- 网络流对策中若干对策解的算法研究,O225
- 基于压缩感知的语音信号编码技术研究,TN912.3
- 无线传感器网络中视频编码的跨层优化研究,TN919.81
- 无线传感器网络中分布式压缩感知关键技术,TN929.5
- 基于压缩感知的多径信道估计及其研究,TN925
- 基于压缩感知的语音稀疏基和投影矩阵构造技术的研究,TN919.8
- 基于稀疏表示的语音信号的最佳投影与其重构技术的研究,TN912.3
- 宽带无线通信中基于压缩感知的信道估计研究,TN92
- 蜂窝网络中基于流量预测的节能关键技术研究,TN929.53
- 压缩感知算法及其在矢量量化中的应用,TN911.7
- 基于压缩感知的信号恢复算法研究,TN911.7
- 基于压缩感知的分布式视频编码技术研究,TN919.81
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|