学位论文 > 优秀研究生学位论文题录展示
传声器阵列语音增强中关键技术的研究
作 者: 马晓红
导 师: 殷福亮
学 校: 大连理工大学
专 业: 信号与信息处理
关键词: 传声器阵列 时延估计 语音活动检测 语音增强 独立分量分析 小波变换
分类号: TN912.35
类 型: 博士论文
年 份: 2006年
下 载: 653次
引 用: 9次
阅 读: 论文下载
内容摘要
语音信号处理是现代通信、多媒体技术及人工智能系统等众多领域应用的核心技术之一。人们在获得语音信号的同时,不可避免地会受到环境噪声、房间混响以及其他说话人的话音干扰。语音增强作为前置处理方案是抑制干扰的一种有效途径。采用常规的单传声器技术,虽然可以对噪声进行一定的抑制,但由于可利用的信息仅限于时/频信息,因此,在强混响环境下,或者是存在干扰语音源时,其干扰抑制效果并不理想。利用传声器阵列提供的空域和时/频信息,则有可能较好地解决这些问题。 传声器阵列系统已经广泛应用于视频会议、语音识别、说话人识别、汽车环境语音获取、混响环境声音拾取、声源定位和助听装置等场合和设备中。上述这些应用情况归纳起来,最主要的两大类应用是传声器阵列声源定位和传声器阵列语音增强。传声器阵列语音增强作为传声器阵列技术的重要应用之一,涉及时延估计、语音活动检测和语音增强方法三项关键技术。本文重点研究了这三项关键技术,主要工作如下: (1)研究了互功率谱相位时延估计方法。该方法是基于时延估计问题的理想模型提出的,仅适用于高信噪比和弱混响情况。为了使该方法适用于低信噪比和中度以上混响情况,本文对互功率谱相位时延估计方法的性能进行了分析,找出了低信噪比和中度以上混响时其性能下降的原因,给出了两种改进的加权函数形式,改善了该方法在低信噪比和中度以上混响情况下的时延估计性能。 (2)在混响情况下,研究了自适应特征值分解时延估计方法。本文对该方法的时延估计性能进行了分析,表明该方法仅适用于弱噪声情况。针对这一问题,本文给出一种小波域的自适应特征值分解时延估计方法,并对其收敛性能进行了分析。该方法利用小波变换抑制噪声,在信噪比最高的尺度下,应用自适应特征值分解方法进行时延估计,改善了自适应特征值分解时延估计方法在低信噪比情况下的时延估计性能。 (3)现有的传声器阵列语音活动检测方法大都是基于单路信号的检测技术,即每一路传声器信号利用单路语音活动检测方法分别进行检测,运算量较大。针对这一问题,本文利用传声器阵列中声源信号之间仅存在时间延迟这一特点,通过对增强后的语音信号进行语音活动检测,以该语音活动检测结果为参考,分别平移相应的时间,同时获得了阵列多路信号的语音活动检测结果。针对相关噪声情况,本文给出一种结合独立分量分析的传声器阵列语音活动检测方法;为了将该思路推广到不相关噪声情况,本文给出一种基于噪声类型判别的传声器阵列语音活动检测方法。 (4)针对仅存在噪声的情况,研究了波束形成类传声器阵列语音增强方法。考虑到固定波束形成方法仅适用于抑制不相关噪声,为了使其适用于相关噪声情况,本文给出
|
全文目录
摘要 4-6 Abstract 6-11 第1章 绪论 11-18 1.1 传声器阵列语音增强应用背景 11 1.2 传声器阵列特点及其应用 11-13 1.2.1 传声器阵列的特点 11-12 1.2.2 传声器阵列的应用 12-13 1.3 传声器阵列语音增强三项关键技术的研究现状 13-16 1.3.1 时延估计技术的研究现状 13-14 1.3.2 语音活动检测技术的研究现状 14-15 1.3.3 语音增强技术的研究现状 15-16 1.4 论文的主要研究内容 16-18 第2章 传声器阵列语音增强中的基础知识 18-35 2.1 传声器阵列模型 18-19 2.2 噪声与噪声场 19-21 2.2.1 噪声 19-20 2.2.2 噪声场 20-21 2.3 语音信号处理的分析工具 21-32 2.3.1 短时傅立叶变换 21-22 2.3.2 小波变换 22-23 2.3.3 盲源分离 23-26 2.3.4 基于条件统计量的最大后验算法 26-27 2.3.5 最小均方误差算法 27-29 2.3.6 子带滤波器组 29-32 2.4 语音增强效果评价方法 32-34 2.4.1 语音质量的主观和客观评价方法 32-33 2.4.2 消噪性能 33-34 2.5 小结 34-35 第3章 传声器阵列语音增强中的时延估计技术 35-61 3.1 引言 35 3.2 传声器阵列语音增强中的时延估计技术 35-39 3.2.1 广义互相关函数方法 35-37 3.2.2 自适应特征值分解时延估计方法 37-39 3.3 改进的互功率谱相位时延估计方法 39-50 3.3.1 互功率谱相位时延估计方法的性能分析 39-40 3.3.2 改进的互功率谱相位时延估计方法 40-42 3.3.3 广义互功率谱相位时延估计方法 42-44 3.3.4 计算机仿真实验结果 44-50 3.4 小波域自适应特征值分解时延估计方法 50-60 3.4.1 自适应特征值分解方法时延估计性能的分析 50 3.4.2 小波域自适应特征值分解时延估计方法 50-60 3.5 小结 60-61 第4章 语音活动检测方法 61-75 4.1 语音活动检测的阈值比较法 61-62 4.1.1 基于频带方差的检测方法 61-62 4.1.2 基于特征空间能量熵的VAD检测方法 62 4.2 基于ICA的阵列信号语音活动检测方法 62-67 4.2.1 基于ICA的阵列信号语音活动检测原理 62-65 4.2.2 计算机仿真实验结果 65-67 4.3 基于噪声类型判别的阵列信号 VAD方法 67-74 4.3.1 基于噪声类型判别的阵列信号 VAD原理 67-69 4.3.2 计算机仿真实验结果 69-74 4.4 小结 74-75 第5章 传声器阵列语音增强 75-99 5.1 波束形成技术 75-77 5.1.1 固定波束形成 75-76 5.1.2 自适应波束形成 76-77 5.2 基于小波变换和波束形成的语音增强 77-87 5.2.1 基于小波变换和波束形成的语音增强原理 77-79 5.2.2 计算机仿真实验结果 79-81 5.2.3 自适应小波阈值语音增强方法 81-87 5.3 基于盲源分离和波束形成的语音增强 87-91 5.3.1 基于盲源分离和波束形成的语音增强方法 88-89 5.3.2 计算机仿真实验结果 89-91 5.4 子带盲源分离和后置处理语音增强 91-97 5.4.1 子带盲源分离和后置处理语音增强方法 91-92 5.4.2 改进LMS自适应噪声抵消器的性能分析 92-95 5.4.3 子带盲源分离和后置处理语音增强改进方法 95 5.4.4 计算机模拟实验结果 95-97 5.5 小结 97-99 第6章 总结与展望 99-101 6.1 总结 99 6.2 进一步工作展望 99-101 参考文献 101-108 攻读博士学位期间发表学术论文情况 108-110 创新点摘要 110-111 致谢 111-112 大连理工大学学位论文版权使用授权书 112
|
相似论文
- 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
- 图像的稀疏表示及编码模型研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 感觉刺激诱发脑电特征研究,R318.0
- 网络传输中的ROI图像编码算法研究,TN919.81
- 移动机器人声源定向方法研究,TP242
- 基于多尺度分析的图像融合算法研究,TP391.41
- 基于小波变换的三维模型特征提取技术的研究与实现,TP391.41
- 轮廓波变换及其在图像处理中的应用,TP391.41
- 基于小波的雷达视频压缩方法研究,TN957.52
- 脊波变换在全色图像和多光谱图像融合中的应用研究,TP391.41
- 一种多数据流聚类异常检测算法,TP311.13
- 基于图像的信息隐藏技术研究,TP309.7
- 基于DM6446与小波的图像压缩系统设计与实现,TP391.41
- 结合DWT的动态数据校正研究及应用,TP274
- 基于小波变换和马尔可夫链的流量预测模型,TP393.06
- 基于小波变换的信号稀疏表示及其在图像去噪中的应用,TP391.41
- 基于离散小波变换的图像水印算法研究,TP309.7
- 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
- 脑部CT图像的压缩应用,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音增强
© 2012 www.xueweilunwen.com
|