学位论文 > 优秀研究生学位论文题录展示
基于振荡神经网络的语音分离算法的研究
作 者: 李沙沙
导 师: 赵增顺
学 校: 山东科技大学
专 业: 控制工程
关键词: 语音分离 局部激励全局抑制的振荡神经网络 计算听觉场景分析
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 23次
引 用: 0次
阅 读: 论文下载
内容摘要
语音分离是实现机器听觉的一个重要而基础性的任务,人们总是希望在一个有多个声音源及各种环境噪声的混合语音中提取出自己感兴趣的声音,这对于我们人类的听觉系统来说是件容易的事,就如“鸡尾酒会效应”里所提到的,人们可以在嘈杂的鸡尾酒会上很准确的捕捉到自己感兴趣的声音。但这对于计算机来讲是十分困难的。对于这个问题的研究很多学者提出了许多的方法。目前对于语音分离主要有盲源分离和基于场景分析两类方法。对于听觉场景分析的研究有两种方法:听觉场景分析,计算听觉场景分析。但是目前的语音分离算法还很难有效地模拟人耳的听觉系统。本文是结合振荡神经网络模型来实现混合语音分离,这个模型的核心是一个两层的振荡神经网络,在这个两层的神经网络中,在振荡相关的基础上实现流分离。在这个振荡相关的结构里,第一层是分段层,将语音信号分成一系列的听觉元素,第二层是组合层,将源自于同一声音源的听觉元素组合起来,是以形成两个同步的振荡块的形式来表现的。在振荡神经网络之前语音信号要经过外围听觉模型以及中级听觉系统,来模拟人耳的频率选择特性,并且提取相关信息。最后一个再合成阶段,是用组合层中形成的两个流对gammatone滤波器的输出进行重新组合,得到分离后的声音流。另外本文还讨论了很多关于生物可信性和实时执行性的一些问题。
|
全文目录
摘要 5-6 Abstract 6-11 1 绪论 11-15 1.1 语音分离概述 11-12 1.2 传统的语音分离的方法 12 1.3 当前的语音分离算法中所存在的问题 12-13 1.4 语音分离的应用 13-14 1.5 本文的研究重点和所做工作 14-15 2 振荡相关神经网络模型分析 15-23 2.1 振荡模型的提出 15-17 2.2 局部激励及全局抑制 17-18 2.3 LEGION模型的工作原理 18-21 2.4 横向势能的引入 21-22 2.5 本章小结 22-23 3 基于振荡神经网络的语音分离算法 23-41 3.1 引言 23-24 3.2 模型概述 24-26 3.3 外围听觉系统模型 26-27 3.4 中级听觉系统的描述 27-30 3.5 双层的振荡神经网络 30-37 3.6 再合成 37-39 3.7 本章小结 39-41 4 评估系统 41-43 4.1 用SNR作为评估指标 41-42 4.2 能量恢复的评估指标 42-43 5 结束语 43-45 5.1 工作总结 43 5.2 展望 43-45 致谢 45-46 参考文献 46-48
|
相似论文
- 复杂环境下语音增强方法研究,TN912.35
- 基于计算听觉场景分析的混合语音分离研究,TP391.42
- 基于空域滤波的语音分离研究,TN912.3
- 移动机器人听觉导航系统中语音分离技术研究,TN912.3
- 多音音乐音高估计研究,TN912.3
- 基于麦克风阵列的语音增强和分离方法研究,TN912.3
- 基于计算声场景分析的混叠语音分离研究,TN912.3
- 听觉场景分析与声源定位的算法研究,TN912.3
- 语音信号增强与分离算法研究,TN912.3
- 非负稀疏信号分解及在单声道声音分离中的应用,TN912.34
- 带噪混叠语音信号盲分离方法研究,TN912.3
- 语音盲分离算法研究,TN912.3
- 语音盲分离算法的研究,TP301.6
- 基于稀疏分解的单通道混合语音分离算法研究,TN912.3
- 说话人识别中不同语音编码影响的补偿方法,TN912.34
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 音乐结构自动分析研究,TN912.3
- 网络语音传输丢包的恢复技术,TN912.3
- 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
- 基于多重分形的语音情感识别研究,TN912.34
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|