学位论文 > 优秀研究生学位论文题录展示

复杂信道下的说话人识别技术

作 者: 武宁
导 师: 薛向阳
学 校: 复旦大学
专 业: 计算机应用技术
关键词: 说话人识别 混合高斯模型 通用背景模型 信道鲁棒 家用服务机器人
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 52次
引 用: 0次
阅 读: 论文下载
 

内容摘要


计算机科学经过几十年的发展,对人们的生产、生活、工作、娱乐等方面产生了重大影响。随着个人电脑,智能设备,移动操作系统的广泛应用及普及,人们对于计算机的交互体验和操作习惯等方面提出更高的要求。语音交互被认为是一种理想的人机交互方式,并逐渐应用于电信、教育、安全等行业。说话人识别是语音处理技术的一个重要分枝,其基本原理是通过对说话人的语音信息进行分析与建模来“了解”用户的声音特征,从而能够辨认出用户的身份。由于高斯混合模型(GMM)能够很好的对说话人声线特征进行拟合,加之训练与识别的算法复杂度很小,已经成为说话人识别问题的一种主流的解决方案,在过去十几年中得到广泛的研究与应用。Reynolds等人在GMM的基础上发展出高斯混合通用背景模型(GMM_UBM),利用通用背景良好的性质,很好地了解决训练语音数据较少时模型训练不充分的难题。本文的主要研究方向为复杂信道下的鲁棒性说话人识别问题,旨在提高非理想环境下的说话人识别系统的识别性能,以增强系统对于各种环境的适应性。论文从识别系统的三个主要方面——语音特征提取、说话人模型训练和身份相似度计算分别进行研究和方案优劣性讨论,采用了“规避”或“补偿”的思想,以抵消或者削减不同信道和采集设备对说话人语音产生的干扰,增强了说话人识别系统对于不同环境的适应能力。机器人有着广阔的应用前景,面向家庭服务的机器人更是未来千家万户的强烈需求。在本文的最后讨论了一款面向家庭服务的机器人——“睿宝”机器人系统中的说话人识别模块,该模块内嵌于机器语音交互子系统中,在机器人与用户进行语音交互的过程中,对交互对象进行身份辨识和命令合法性确认的工作,很大程度上提高了机器人的安全性和智能性。

全文目录


摘要  5-6
Abstract  6-7
第一章 引言  7-14
  1.1 说话人识别技术  8-9
  1.2 应用领域  9-10
  1.3 技术分类  10-11
  1.4 研究现状  11-12
  1.5 论文工作与组织安排  12-14
第二章 说话人识别基础知识  14-23
  2.1 语言的基本过程  14-16
  2.2 基本处理过程  16-17
  2.3 核心关键问题  17-21
  2.4 评分标准  21-22
  2.5 小结  22-23
第三章 MFCC特征  23-29
  3.1 梅尔尺度  24-25
  3.2 MFCC及特征提取  25-28
  3.3 小结  28-29
第四章 基于混合高斯模型的说话人识别  29-43
  4.1 高斯混合模型  30-32
  4.2 基于GMM的说话人模型  32-35
  4.3 基于GMM的说话人识别过程  35-36
  4.4 基于GMM_UBM的通用背景模型  36-40
  4.5 基于GMM_UBM的说话人模型训练  40-41
  4.6 基于GMM_UBM模型的识别过程  41-42
  4.7 小结  42-43
第五章 复杂信道下说话人识别  43-52
  5.1 信道的影响  43-44
  5.2 信道鲁棒算法  44-46
  5.3 模型域的信道鲁棒算法  46-50
  5.4 分数域的信道鲁棒算法  50-51
  5.5 小结  51-52
第六章 面向家用机器人的说话人识别系统  52-59
  6.1 家用机器人中的说话人识别  52-53
  6.2 系统框架及改进方案  53-56
  6.3 实验结果  56-58
  6.4 小结  58-59
第七章 总结与展望  59-60
攻读硕士学位期间的科研成果  60-61
参考文献  61-64
致谢  64-65

相似论文

  1. 复杂场景中运动目标的检测与跟踪,TP391.41
  2. 运动目标检测与跟踪的研究,TP391.41
  3. 视频监控系统中的运动目标检测算法研究,TP391.41
  4. 嵌入式目标检测与跟踪系统设计及算法实现,TP391.41
  5. 基于粒子滤波与Mean Shift平滑运动跟踪的研究与实现,TP391.41
  6. 分布式声源定位与跟踪算法研究,TN912.3
  7. 基于VC++6.0的说话人识别系统的研究,TN912.34
  8. 智能交通视频监控系统中关键技术研究,TP391.41
  9. 边界防御系统中移动目标跟踪技术研究与实现,TP391.41
  10. 基于粒子滤波与Mean Shift平滑运动跟踪的研究与实现,TP391.41
  11. 基于移动网络的智能视频监控系统的设计,TP391.41
  12. 基于混合特征和高斯混合模型的说话人识别研究,TN912.34
  13. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  14. 说话人识别中特征参数的提取及优化研究,TN912.34
  15. 基于文本无关的说话人识别研究,TN912.34
  16. 智能视觉监控中运动目标检测与跟踪的研究,TP391.41
  17. 基于计算机视觉的目标识别应用技术研发,TP391.41
  18. 多路并行实时说话人识别算法研究与实现,TN912.34
  19. 面向高速铁路的轨道异物检测研究,U216.3
  20. 视频监控中运动目标检测与跟踪算法的研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com