学位论文 > 优秀研究生学位论文题录展示

基于振荡神经网络的语音分离算法的研究

作　者: 李沙沙
导　师: 赵增顺
学　校: 山东科技大学
专　业: 控制工程
关键词: 语音分离局部激励全局抑制的振荡神经网络计算听觉场景分析
分类号: TN912.3
类　型: 硕士论文
年　份: 2011年
下　载: 23次
引　用: 0次
阅　读: 论文下载

内容摘要

语音分离是实现机器听觉的一个重要而基础性的任务,人们总是希望在一个有多个声音源及各种环境噪声的混合语音中提取出自己感兴趣的声音,这对于我们人类的听觉系统来说是件容易的事,就如“鸡尾酒会效应”里所提到的,人们可以在嘈杂的鸡尾酒会上很准确的捕捉到自己感兴趣的声音。但这对于计算机来讲是十分困难的。对于这个问题的研究很多学者提出了许多的方法。目前对于语音分离主要有盲源分离和基于场景分析两类方法。对于听觉场景分析的研究有两种方法：听觉场景分析,计算听觉场景分析。但是目前的语音分离算法还很难有效地模拟人耳的听觉系统。本文是结合振荡神经网络模型来实现混合语音分离,这个模型的核心是一个两层的振荡神经网络,在这个两层的神经网络中,在振荡相关的基础上实现流分离。在这个振荡相关的结构里,第一层是分段层,将语音信号分成一系列的听觉元素,第二层是组合层,将源自于同一声音源的听觉元素组合起来,是以形成两个同步的振荡块的形式来表现的。在振荡神经网络之前语音信号要经过外围听觉模型以及中级听觉系统,来模拟人耳的频率选择特性,并且提取相关信息。最后一个再合成阶段,是用组合层中形成的两个流对gammatone滤波器的输出进行重新组合,得到分离后的声音流。另外本文还讨论了很多关于生物可信性和实时执行性的一些问题。

全文目录

摘要  5-6
Abstract  6-11
1 绪论  11-15
  1.1 语音分离概述  11-12
  1.2 传统的语音分离的方法  12
  1.3 当前的语音分离算法中所存在的问题  12-13
  1.4 语音分离的应用  13-14
  1.5 本文的研究重点和所做工作  14-15
2 振荡相关神经网络模型分析  15-23
  2.1 振荡模型的提出  15-17
  2.2 局部激励及全局抑制  17-18
  2.3 LEGION模型的工作原理  18-21
  2.4 横向势能的引入  21-22
  2.5 本章小结  22-23
3 基于振荡神经网络的语音分离算法  23-41
  3.1 引言  23-24
  3.2 模型概述  24-26
  3.3 外围听觉系统模型  26-27
  3.4 中级听觉系统的描述  27-30
  3.5 双层的振荡神经网络  30-37
  3.6 再合成  37-39
  3.7 本章小结  39-41
4 评估系统  41-43
  4.1 用SNR作为评估指标  41-42
  4.2 能量恢复的评估指标  42-43
5 结束语  43-45
  5.1 工作总结  43
  5.2 展望  43-45
致谢  45-46
参考文献  46-48

基于振荡神经网络的语音分离算法的研究

内容摘要

全文目录

相似论文