学位论文 > 优秀研究生学位论文题录展示

基于麦克风阵列的多声源测向方法研究

作 者: 顾添翼
导 师: 赵兆
学 校: 南京理工大学
专 业: 电路与系统
关键词: 麦克风阵列 多源测向 时延估计 相位模糊 实时处理
分类号: TN912.3
类 型: 硕士论文
年 份: 2014年
下 载: 22次
引 用: 0次
阅 读: 论文下载
 

内容摘要


基于麦克风阵列的多声源测向技术通过对麦克风阵列接收的多声源混合信号进行处理,从而确定各个声源的方位。它在很多领域都具有广泛的应用前景和实际意义,如在民用方面的视/音频会议、语音识别及增强等领域中,常利用声源测向技术精确估计出说话人位置来控制摄像头,使其自动对该位置的语音信号进行增强。在军事方面声源测向技术被广泛地应用在飞机,火炮、狙击手探测等方面。因此,该技术成为了语音信号处理领域的研究热点之一。本课题针对基于麦克风阵列多声源测向问题展开研究,归纳总结并比较了传统的几类声源测向方法。本文以典型的双阵元麦克风阵列为研究对象,针对远场多声源模型,将基于语音信号时频正交特性的退化分离估计技术(DUET)应用于声源信号测向。该算法利用了语音信号特有的时频稀疏和短时正交特性(W-Disjoint Orthogonality, W-DO),基于此特性的时延估计算法计算量小,实现简单,仅用两个麦克风就可以实现多个声源的方位测向。但是当声源存在波长小于两倍阵元间距的高频成分时,此类声源测向方法将出现相位卷绕模糊问题,而阵元间距因物理尺寸限制也不可能无限缩小,因此限制了该类方法的实际应用领域。针对上述问题,本文提出了一种基于迭代时频掩蔽的宽间距麦克风阵列多声源测向方法,该方法通过迭代消去过程,显著抑制了相位卷绕产生的影响。此外,结合基于能量的语音端点检测技术,本文进一步给出了上述方法的实时处理算法步骤。针对上述方法,本文进行了仿真实验和相关外场实验,实验结果表明:针对宽间距麦克风阵列多声源测向,本文所述方法明显优于常规DUET类方法,具有一定的实际应用价值。

全文目录


摘要  3-4
Abstract  4-7
1 绪论  7-11
  1.1 课题的研究背景及意义  7-8
  1.2 基于麦克风阵列的声源测向技术简介  8-9
    1.2.1 麦克风阵列声源测向技术的特点  8
    1.2.2 麦克风阵列声源测向技术的应用领域  8-9
  1.3 论文的结构安排  9-11
2 基于麦克风阵列的声源测向算法  11-16
  2.1 基于最大输出功率的可控波束形成的方法  11-13
  2.2 基于高分辨率谱估计技术的方法  13
  2.3 基于声压幅度比的方法  13-15
  2.4 基于时延估计的方法  15
  2.5 本章小结  15-16
3 双阵元麦克风阵列时延估计方法  16-32
  3.1 双阵元麦克风阵列信号模型  16-18
  3.2 传统的时延估计算法  18-24
    3.2.1 广义互相关函数法(GCC)  18-22
    3.2.2 最小均方(LMS)自适应滤波  22-23
    3.2.3 互功率谱相位法  23-24
  3.3 基于声源信号时频正交特性的时延估计方法(DUET)  24-31
    3.3.1 语音信号的加窗分帧处理  24-26
    3.3.2 W-Disjoint Orthogonality(WDO)特性  26-28
    3.3.3 DUET算法主要流程及仿真结果  28-31
    3.3.4 DUET算法的局限性  31
  3.4 本章小结  31-32
4 基于迭代时频掩蔽的宽间距麦克风阵列相位解卷绕  32-43
  4.1 迭代时频掩蔽方法  32-35
  4.2 算法仿真及外场实验结果与分析  35-42
    4.2.1 宽间距麦克风阵列双声源测向仿真实验结果与分析  35-37
    4.2.2 宽间距麦克风阵列三声源测向仿真实验结果与分析  37-39
    4.2.3 外场实测结果与分析  39-42
  4.3 本章小结  42-43
5 基于迭代时频掩蔽的宽间距麦克风实时多声源测向  43-50
  5.1 实时多声源测向方法  43-47
    5.1.1 语音端点检测  43-45
    5.1.2 实时多源测向法的具体步骤  45-47
  5.2 仿真实验结果与分析  47-49
  5.3 本章小结  49-50
6 结论与展望  50-51
  6.1 结论  50
  6.2 展望  50-51
致谢  51-52
参考文献  52-55
附录  55

相似论文

  1. FPGA/DSP图像协处理技术及以太网数据传输,TP391.41
  2. 图像实时采集、存储与处理方法研究,TP391.41
  3. 声学计算机键盘原理研究与实现,TP334.23
  4. 移动机器人声源定向方法研究,TP242
  5. ESPRIT参数估计算法在宽带移动信道中的应用,TN925
  6. 球麦克风阵列波束形成语音增强方法的研究,TN912.35
  7. 基于麦克风阵列的移动机器人听觉定位方法研究,TP242
  8. 分布式麦克风阵列跟踪算法研究,TN912.3
  9. 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
  10. 基于信号相位差的海水声速测量方法研究,TB566
  11. 宽带ISAR实时干扰技术及实现,TN957.52
  12. 基于时延估计的声源定位系统的设计与实现,TN912.3
  13. 无人机载SAR实时成像处理技术研究,TN957.52
  14. 基于OMAP3530的麦克风阵列生命探测仪的设计与实现,TN912.2
  15. 基于时延估计的被动声定位研究,TB52
  16. 基于IR-UWB的室内无线通信定位技术的研究,TN925
  17. 基于TDOA的JTIDS信号辐射源定位关键技术研究,TN911.23
  18. 干涉仪快速测向算法的研究与实现,TH744.3
  19. 基于广域网络测量传感器阵列的大气低频次声波观测研究,TP212
  20. RFID时延估计算法的研究,TP391.44
  21. 基于传声器阵列的三维空间声源定位系统的研究,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com