学位论文 > 优秀研究生学位论文题录展示
带噪混叠语音信号盲分离方法研究
作 者: 赵彩华
导 师: 刘琚
学 校: 山东大学
专 业: 信号与信息处理
关键词: 带噪混叠语音 语音分离 独立分量分析 小波变换 稀疏编码
分类号: TN912.3
类 型: 硕士论文
年 份: 2006年
下 载: 425次
引 用: 2次
阅 读: 论文下载
内容摘要
竞争说话者的干扰是语音通信过程中一种常见的干扰情况。人类的听觉系统可以在多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种感知能力,也就是人类的语音分离的能力,称为“鸡尾酒会效应”。 在语音和听觉信号处理领域中,如何从多个说话者的混叠语音信号中分离出各个语音源信号或提取出人们感兴趣的目标语音,来模仿人类的语音分离能力,成为一个重要的研究问题。这也是稳健(Robust)语音信号处理中的一个重要研究方向,对语音识别、语音增强等都有着非常积极的促进意义。 目前的混叠语音分离大多是建立在无噪环境中的混叠情形下,主要以盲源分离(Blind Source Separation,BSS)和计算声场景分析(Computational Auditory Scene Analysis,CASA)两类方法为主,前者是根据信号的统计特性从几个观测信号中恢复出未知的独立源成分;后者则是利用人耳的听觉感知要素从混叠语音中分离出感兴趣的目标语音。通常为了研究方便,这些算法都不考虑环境噪声的影响。然而,在实际语音通信中,不可避免会受到周围环境噪声的影响,因此寻找有效的带噪混叠语音分离方法具有非常重要的理论价值和实际意义。 带噪混叠语音包含了多个说话者和环境噪声,其分离较为困难。目前,一些学者正致力于带噪盲源分离算法的研究,但总体研究成果不多;而噪声环境中的感知要素检测困难使计算声场景分析方法受到一定的局限性。国内外现有的关于带噪混叠语音分离的研究成果非常少。 独立分量分析(Independent Component Analysis,ICA),是在研究盲源分离过程中出现的一种新兴的盲分离技术,自其出现便成为信号处理、数值分析、统计及神经网络等领域中的热点研究问题,并在语音处理、生物医学信号处理、模式识别、特征提取、数据压缩、图像处理和电子通讯等方面获得了非常广泛的应用。目前已有不少学者提出了多种有效的ICA算法,但是这些ICA算法大多都不考虑环境噪声的影响,在解决无噪或低噪情况下的混叠语音分离时具有非常优越的分离性能,但是当环境噪声较大时分离效
|
全文目录
中文摘要 6-8 ABSTRACT 8-11 符号说明 11-13 第一章 绪论 13-20 1.1 课题的研究背景和意义 13-15 1.2 独立分量分析 15-17 1.3 带噪混叠语音盲分离 17-18 1.4 本论文主要研究内容和贡献 18-20 第二章 独立分量分析 20-33 2.1 引言 20-22 2.2 ICA数学模型 22-23 2.3 ICA约束条件和不确定性 23-25 2.3.1 约束条件 23-24 2.3.2 不确定性 24-25 2.4 ICA中的预处理 25-27 2.4.1 去均值 25-26 2.4.2 预白化 26-27 2.5 经典ICA算法 27-32 2.5.1 基于非高斯性测度的方法 27-29 2.5.2 基于高阶统计的方法 29 2.5.3 基于信息理论的方法 29-32 2.6 带噪盲分离问题 32-33 第三章 基于小波变换和ICA的带噪混叠语音盲分离方案 33-45 3.1 引言 33-34 3.2 带噪混叠语音模型 34 3.3 Fast ICA算法 34-36 3.4 基于小波变换和ICA的分离方案 36-37 3.5 小波消噪处理 37-39 3.6 实验结果及分析比较 39-43 3.7 小结 43-45 第四章 基于稀疏编码和ICA的带噪混叠语音盲分离方案 45-57 4.1 引言 45-46 4.2 稀疏编码去噪 46-50 4.2.1 稀疏编码去噪原理 46-47 4.2.2 对带噪语音进行稀疏编码去噪 47-48 4.2.3 基于ICA特征提取的稀疏表征W′ 48-50 4.3 JADE算法 50-51 4.4 基于稀疏编码和ICA的分离方案 51-52 4.5 实验结果及分析比较 52-55 4.6 小结 55-57 第五章 总结与展望 57-60 附录A 语音数据库简介 60-62 附录B 几种语音处理软件 62-65 1.Cool Edit简介 62-63 2.Praat简介 63 3.Spectrum简介 63-65 参考文献 65-72 致谢 72-73 攻读硕士学位期间发表和投出的论文 73-75 学位论文评阅及答辩情况表 75
|
相似论文
- 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
- 图像的稀疏表示及编码模型研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 基于多尺度分析的图像融合算法研究,TP391.41
- 基于小波变换的三维模型特征提取技术的研究与实现,TP391.41
- 轮廓波变换及其在图像处理中的应用,TP391.41
- 基于小波的雷达视频压缩方法研究,TN957.52
- 一种多数据流聚类异常检测算法,TP311.13
- 基于图像的信息隐藏技术研究,TP309.7
- 基于DM6446与小波的图像压缩系统设计与实现,TP391.41
- 结合DWT的动态数据校正研究及应用,TP274
- 基于小波变换和马尔可夫链的流量预测模型,TP393.06
- 基于小波变换的信号稀疏表示及其在图像去噪中的应用,TP391.41
- 基于离散小波变换的图像水印算法研究,TP309.7
- 脑部CT图像的压缩应用,TP391.41
- 一类工具加工痕迹的检验识别,TP391.41
- 基于燃烧音识别的火灾探测系统的研究与设计,X924.4
- 基于SPIHT的可伸缩码流编码器的实现和研究,TN762
- 低比特率下基于DWT的视频编解码系统研究与实现,TN919.81
- 一种基于SPIHT改进的ROI图像编码方法,TN919.81
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|