学位论文 > 优秀研究生学位论文题录展示

基于麦克风阵列的多声源测向方法研究

作　者: 顾添翼
导　师: 赵兆
学　校: 南京理工大学
专　业: 电路与系统
关键词: 麦克风阵列多源测向时延估计相位模糊实时处理
分类号: TN912.3
类　型: 硕士论文
年　份: 2014年
下　载: 22次
引　用: 0次
阅　读: 论文下载

内容摘要

基于麦克风阵列的多声源测向技术通过对麦克风阵列接收的多声源混合信号进行处理,从而确定各个声源的方位。它在很多领域都具有广泛的应用前景和实际意义,如在民用方面的视/音频会议、语音识别及增强等领域中,常利用声源测向技术精确估计出说话人位置来控制摄像头,使其自动对该位置的语音信号进行增强。在军事方面声源测向技术被广泛地应用在飞机,火炮、狙击手探测等方面。因此,该技术成为了语音信号处理领域的研究热点之一。本课题针对基于麦克风阵列多声源测向问题展开研究,归纳总结并比较了传统的几类声源测向方法。本文以典型的双阵元麦克风阵列为研究对象,针对远场多声源模型,将基于语音信号时频正交特性的退化分离估计技术(DUET)应用于声源信号测向。该算法利用了语音信号特有的时频稀疏和短时正交特性(W-Disjoint Orthogonality, W-DO),基于此特性的时延估计算法计算量小,实现简单,仅用两个麦克风就可以实现多个声源的方位测向。但是当声源存在波长小于两倍阵元间距的高频成分时,此类声源测向方法将出现相位卷绕模糊问题,而阵元间距因物理尺寸限制也不可能无限缩小,因此限制了该类方法的实际应用领域。针对上述问题,本文提出了一种基于迭代时频掩蔽的宽间距麦克风阵列多声源测向方法,该方法通过迭代消去过程,显著抑制了相位卷绕产生的影响。此外,结合基于能量的语音端点检测技术,本文进一步给出了上述方法的实时处理算法步骤。针对上述方法,本文进行了仿真实验和相关外场实验,实验结果表明：针对宽间距麦克风阵列多声源测向,本文所述方法明显优于常规DUET类方法,具有一定的实际应用价值。

全文目录

摘要  3-4
Abstract  4-7
1 绪论  7-11
  1.1 课题的研究背景及意义  7-8
  1.2 基于麦克风阵列的声源测向技术简介  8-9
    1.2.1 麦克风阵列声源测向技术的特点  8
    1.2.2 麦克风阵列声源测向技术的应用领域  8-9
  1.3 论文的结构安排  9-11
2 基于麦克风阵列的声源测向算法  11-16
  2.1 基于最大输出功率的可控波束形成的方法  11-13
  2.2 基于高分辨率谱估计技术的方法  13
  2.3 基于声压幅度比的方法  13-15
  2.4 基于时延估计的方法  15
  2.5 本章小结  15-16
3 双阵元麦克风阵列时延估计方法  16-32
  3.1 双阵元麦克风阵列信号模型  16-18
  3.2 传统的时延估计算法  18-24
    3.2.1 广义互相关函数法(GCC)  18-22
    3.2.2 最小均方(LMS)自适应滤波  22-23
    3.2.3 互功率谱相位法  23-24
  3.3 基于声源信号时频正交特性的时延估计方法(DUET)  24-31
    3.3.1 语音信号的加窗分帧处理  24-26
    3.3.2 W-Disjoint Orthogonality(WDO)特性  26-28
    3.3.3 DUET算法主要流程及仿真结果  28-31
    3.3.4 DUET算法的局限性  31
  3.4 本章小结  31-32
4 基于迭代时频掩蔽的宽间距麦克风阵列相位解卷绕  32-43
  4.1 迭代时频掩蔽方法  32-35
  4.2 算法仿真及外场实验结果与分析  35-42
    4.2.1 宽间距麦克风阵列双声源测向仿真实验结果与分析  35-37
    4.2.2 宽间距麦克风阵列三声源测向仿真实验结果与分析  37-39
    4.2.3 外场实测结果与分析  39-42
  4.3 本章小结  42-43
5 基于迭代时频掩蔽的宽间距麦克风实时多声源测向  43-50
  5.1 实时多声源测向方法  43-47
    5.1.1 语音端点检测  43-45
    5.1.2 实时多源测向法的具体步骤  45-47
  5.2 仿真实验结果与分析  47-49
  5.3 本章小结  49-50
6 结论与展望  50-51
  6.1 结论  50
  6.2 展望  50-51
致谢  51-52
参考文献  52-55
附录  55

基于麦克风阵列的多声源测向方法研究

内容摘要

全文目录

相似论文