学位论文 > 优秀研究生学位论文题录展示

基于稀疏分解的单通道混合语音分离算法研究

作　者: 郭海燕
导　师: 杨震
学　校: 南京邮电大学
专　业: 信号与信息处理
关键词: 语音分离稀疏分解压缩感知字典学习线性规划
分类号: TN912.3
类　型: 博士论文
年　份: 2011年
下　载: 88次
引　用: 0次
阅　读: 论文下载

内容摘要

单通道混合语音分离是语音分离研究的重要方向,稀疏分解理论的发展为解决单通道混合语音分离问题提供了新的思路。正因为如此,本论文主要研究基于稀疏分解的单通道混合语音分离算法。借鉴稀疏分解和随之发展起来的压缩感知的理论成果,通过字典学习,构造合适的与源语音信号自适应的基或字典,在此基础上,采用l0 -范数优化算法,设计有效的基于稀疏分解的单通道混合语音分离算法和基于压缩感知的单通道混合语音分离算法,以达到增强目标语音,抑制干扰语音的目的。本论文的主要工作和创新如下:①从探讨如何构造与源语音信号自适应的基或字典出发,提出通过对角化源语音信号自相关矩阵,构造理想准KLT基,并从理论上证明,任何信号在理想准KLT基下都具有稀疏性。鉴于在实际情况下,不一定能获得确切的理想准KLT基,提出通过选取合适的模板和计算相应的模板匹配系数,来近似语音信号的自相关矩阵,再对近似的自相关矩阵进行特征值分解,构造两种实用的模板匹配准KLT基—非齐次线性均方估计模板匹配准KLT基和正交匹配追踪模板匹配准KLT基。仿真表明,浊音信号在模板匹配准KLT基下的特性与在理想准KLT基下的特性相近。②以创新点①为基础,研究基于准KLT基的单通道混合语音分离。a从理论上证明,当基函数满足一定的条件时,采用l0 -范数优化算法,可以实现单通道混合语音的完美分离,并进一步证明理想准KLT基满足该条件b由于实际语音分离时,源信号未知,故无法获得理想准KLT基,提出对上述两种模板匹配准KLT基构造方法进行改进,以混合语音信号为已知条件,来构造各源语音信号的模板匹配准KLT基。在此基础上,提出了两种实用的基于模板匹配准KLT基的单通道混合语音分离算法—基于非齐次线性均方估计模板匹配准KLT基的分离算法和基于正交匹配追踪模板匹配准KLT基的分离算法。仿真表明,该算法的性能优于现有的基于独立成分分析基的分离算法和采用形分析技术改进后的计算机场景分析算法。③论文将压缩感知和单通道混合语音分离相联系,研究基于压缩感知的单通道混合语音分离。a从压缩感知的视角看待单通道混合语音分离问题,设计基于压缩感知和K-SVD的单通道混合语音分离算法。仿真表明,该算法对各类混合语音的分离效果相差不大,性能稳定。b在DCT域设计基于能量特性的帧间帧内自适应语音压缩感知观测构造算法,以进一步减少基于压缩感知的源语音信号的“采样率”,为研究基于压缩感知观测特性的单通道混合语音分离奠定基础。仿真表明,该算法的性能优于贝叶斯压缩感知算法的性能。

全文目录

摘要  6-8
ABSTRACT  8-10
缩略语  10-12
图表说明  12-15
目录  15-17
第一章绪论  17-38
  1.1 单通道混合语音分离的概念及研究意义  17-19
  1.2 单通道混合语音分离的研究现状  19-25
    1.2.1 基于统计模型的单通道混合语音分离方法  19-21
    1.2.2 计算机听觉场景分析  21-23
    1.2.3 基于投影分解的单通道混合语音分离方法  23-25
  1.3 基于稀疏分解的单通道混合语音分离算法现状  25-34
    1.3.1 字典的构造方法  25-28
    1.3.2 信号的稀疏分解  28-30
    1.3.3 基于稀疏分解的单通道混合语音分离算法研究现状  30-34
  1.4 课题来源及意义  34-35
  1.5 论文的研究内容及成果  35-36
  1.6 本文后续的安排  36-38
第二章语音信号模板匹配准KLT 基的构造算法  38-74
  2.1 理想准KLT 基的构造  38-42
    2.1.1 理论分析  38-40
    2.1.2 仿真结果  40
    2.1.3 讨论  40-42
  2.2 NLMSE 模板匹配准KLT 基的构造  42-57
    2.2.1 算法原理  42-45
    2.2.2 仿真结果  45-57
  2.3 OMP 模板匹配准KLT 基  57-69
    2.3.1 算法原理  57-60
    2.3.2 仿真结果  60-69
  2.4 不同基的性能比较  69-72
    2.4.1 NLMSE 模板匹配准KLT 基和OMP 模板匹配准KLT 基的比较  69-70
    2.4.2 DCT 基与模板匹配准KLT 基的比较  70-72
  2.5 本章小结  72-74
第三章基于准KLT 基的单通道混合语音分离  74-99
  3.1 基于理想准KLT 基的单通道混合语音分离  75-81
    3.1.1 理论分析  75-78
    3.1.2 仿真结果  78-81
  3.2 基于NLMSE 模板匹配准KLT 基的单通道混合语音分离算法  81-89
    3.2.1 算法原理  81-83
    3.2.2 仿真结果  83-86
    3.2.3 讨论与分析  86-89
  3.3 基于OMP 模板匹配准KLT 基的单通道混合语音分离  89-96
    3.3.1 算法原理  89-91
    3.3.2 仿真结果  91-95
    3.3.3 讨论与分析  95-96
  3.4 不同算法的性能比较  96-98
  3.5 本章小结  98-99
第四章基于CS 的单通道混合语音分离  99-123
  4.1 CS 的基本原理  100-102
  4.2 基于CS 和K-SVD 的单通道混合语音分离  102-111
    4.2.1 CS 与单通道混合语音分离的联系  102-103
    4.2.2 基于CS 和K-SVD 的单通道混合语音分离  103-105
    4.2.3 仿真结果  105-109
    4.2.4 比较与分析  109-111
  4.3 基于自适应CS 观测特性的单通道混合语音分离  111-121
    4.3.1 DCT 域语音信号的自适应CS 方案  111-115
    4.3.2 仿真结果  115-120
    4.3.3 比较与分析  120-121
  4.4 本章小结  121-123
第五章结束语  123-126
参考文献  126-138
攻读博士期间撰写的学术论文  138-139
攻读博士期间参加的科研项目  139-140
致谢  140

基于稀疏分解的单通道混合语音分离算法研究

内容摘要

全文目录

相似论文