学位论文 > 优秀研究生学位论文题录展示

基于麦克风阵列的声源定位与语音增强方法研究

作　者: 崔玮玮
导　师: 曹志刚
学　校: 清华大学
专　业: 信息与通信工程
关键词: 麦克风阵列波束形成时延估计声源定位语音增强
分类号: TN912.35
类　型: 博士论文
年　份: 2009年
下　载: 1021次
引　用: 8次
阅　读: 论文下载

内容摘要

在免提电话、视频会议等语音通信系统中,由于受到混响和背景噪声干扰,麦克风接收到的信号通常为带噪语音。这样不仅影响语音的可懂度,而且影响语音处理系统的整体性能。因此需要对带噪语音进行增强处理。在复杂的声学环境下,单麦克风语音增强已无法满足需求,而麦克风阵列处理技术能够捕捉声源位置并对带噪语音进行空间滤波,从而取得明显的消噪效果。在此背景下,本论文研究了基于麦克风阵列的声源定位和语音增强方法,主要工作如下:(1)归纳并总结了各种时延估计(time delay estimation, TDE)技术,特别针对一些常用的TDE方法进行了深入讨论,包括对定源和动源的跟踪能力,不同混响和信噪比条件下的抗干扰稳健性,以及算法的计算量。通过仿真结果总结出了它们各自的优缺点及适用场合。(2)提出一种双麦克风2D平面定位方法:该方法通过同时考虑阵列接收信号的时延和能量信息,将传统双步定位方法中所需的3个麦克风减为2个,降低了设备成本。在此基础上获得的闭式解方便了算法的快速处理。进而针对该定位模型,在测量噪声服从高斯分布的假设下,本论文推导出位置估计方差的Cramer-Rao下界,并由此分析了不同参数对定位结果的影响。(3)提出一种基于搜索空间预估计的高分辨方位(direction of arrival, DOA)估计方法:本论文利用TDE结果来获得高分辨DOA估计的搜索空间。这不仅使得计算量小于现有算法的1/3,而且还能够部分地去除干扰噪声的方向。在会议室环境下,实际定位系统(包含7个麦克风)的测试结果表明:在加入和未加入搜索空间预估计时,DOA估计的最大误差分别为4.4?和11.4?。(4)提出一种基于一阶差分麦克风(first-order di?erential microphone, FDM)阵列的谱域语音增强方法:该方法利用双通道的FDM阵列,并结合单通道的谱增强技术,可以同时提取语音和噪声谱估计,并实时地修正噪声谱。与现有的双通道语音增强技术相比,该算法可以获得2dB～6dB的输出信噪比增益,且计算量减少了2/3。

全文目录

摘要  4-5
Abstract  5-11
第1章绪论  11-25
  1.1 研究背景  11-12
  1.2 阵列信号处理的背景知识  12-15
    1.2.1 波动方程  12-13
    1.2.2 麦克风阵列与波束形成  13-14
    1.2.3 空间采样定理  14-15
  1.3 麦克风阵列语音信号处理模型  15-19
    1.3.1 带噪语音模型  16-17
    1.3.2 室内混响  17-19
  1.4 研究现状  19-23
    1.4.1 麦克风阵列声源定位技术的研究现状  19-21
    1.4.2 麦克风阵列语音增强技术的研究现状  21-23
  1.5 本论文的研究内容和组织结构  23-25
第2章时间延迟估计技术  25-62
  2.1 引言  25-26
  2.2 时间延迟估计  26-40
    2.2.1 麦克风信号产生模型  26-27
    2.2.2 广义互相关时延估计法  27-29
    2.2.3 倒谱预滤波时延估计法  29-32
    2.2.4 互功率谱相位时延估计法  32
    2.2.5 结合语音特性的基音加权时延估计法  32-33
    2.2.6 基于人耳感知特性的时延估计  33-34
    2.2.7 基于LMS的自适应时延估计法  34-36
    2.2.8 基于子空间分解的时延估计法  36-38
    2.2.9 基于声学传递函数比的时延估计法  38-40
  2.3 仿真实验  40-62
    2.3.1 仿真环境  41-42
    2.3.2 数据处理  42-46
    2.3.3 算法评估  46
    2.3.4 实验结果与分析  46-52
    2.3.5 结论  52-62
第3章基于TDOA的定位方法  62-92
  3.1 引言  62-63
  3.2 声源定位技术概述  63-64
  3.3 基于TDOA的定位方法  64-73
    3.3.1 定位问题的数学模型  65-66
    3.3.2 误差函数  66-67
    3.3.3 最大似然估计器  67-69
    3.3.4 最小二乘估计器  69-73
    3.3.5 迭代高斯法和扩展的卡尔曼滤波法  73
  3.4 基于双耳电平差的定位方法  73-75
  3.5 基于双麦克风的2D平面定位算法  75-92
    3.5.1 信号模型和算法描述  75-79
    3.5.2 定位算法的误差性能分析  79-87
    3.5.3 仿真与实验结果  87-89
    3.5.4 结论  89-92
第4章基于超分辨率谱分析的定位方法  92-110
  4.1 引言  92-95
  4.2 经典MUSIC算法  95-98
  4.3 基于搜索空间预估计的高分辨DOA估计方法  98-110
    4.3.1 算法描述  98-102
    4.3.2 仿真和实验结果  102-108
    4.3.3 结论  108-110
第5章麦克风阵列语音增强方法  110-147
  5.1 引言  110
  5.2 麦克风阵列语音增强方法概述  110-113
  5.3 固定波束形成技术  113-118
    5.3.1 延迟和波束形成技术  113-114
    5.3.2 MVDR与超方向性波束形成器  114-117
    5.3.3 消噪性能分析  117-118
  5.4 自适应侧向阵列波束形成技术  118-125
    5.4.1 线性约束最小方差波束形成算法  118-122
    5.4.2 广义旁瓣抵消算法  122-124
    5.4.3 消噪性能分析  124-125
  5.5 自适应轴向阵列波束形成技术  125-133
    5.5.1 一阶差分麦克风阵列波束形成  125-130
    5.5.2 消噪性能分析  130-133
  5.6 基于FDM阵列的谱域语音增强方法  133-147
    5.6.1 双通道信号模型和算法描述  134-138
    5.6.2 仿真与实验结果  138-143
    5.6.3 结论  143-147
第6章研究工作总结和未来展望  147-150
  6.1 本论文工作总结及主要创新点  147-148
  6.2 未来展望  148-150
参考文献  150-157
致谢  157-158
个人简历、在学期间发表的学术论文与研究成果  158-159

基于麦克风阵列的声源定位与语音增强方法研究

内容摘要

全文目录

相似论文