学位论文 > 优秀研究生学位论文题录展示
复杂信道下的说话人识别技术
作 者: 武宁
导 师: 薛向阳
学 校: 复旦大学
专 业: 计算机应用技术
关键词: 说话人识别 混合高斯模型 通用背景模型 信道鲁棒 家用服务机器人
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 52次
引 用: 0次
阅 读: 论文下载
内容摘要
计算机科学经过几十年的发展,对人们的生产、生活、工作、娱乐等方面产生了重大影响。随着个人电脑,智能设备,移动操作系统的广泛应用及普及,人们对于计算机的交互体验和操作习惯等方面提出更高的要求。语音交互被认为是一种理想的人机交互方式,并逐渐应用于电信、教育、安全等行业。说话人识别是语音处理技术的一个重要分枝,其基本原理是通过对说话人的语音信息进行分析与建模来“了解”用户的声音特征,从而能够辨认出用户的身份。由于高斯混合模型(GMM)能够很好的对说话人声线特征进行拟合,加之训练与识别的算法复杂度很小,已经成为说话人识别问题的一种主流的解决方案,在过去十几年中得到广泛的研究与应用。Reynolds等人在GMM的基础上发展出高斯混合通用背景模型(GMM_UBM),利用通用背景良好的性质,很好地了解决训练语音数据较少时模型训练不充分的难题。本文的主要研究方向为复杂信道下的鲁棒性说话人识别问题,旨在提高非理想环境下的说话人识别系统的识别性能,以增强系统对于各种环境的适应性。论文从识别系统的三个主要方面——语音特征提取、说话人模型训练和身份相似度计算分别进行研究和方案优劣性讨论,采用了“规避”或“补偿”的思想,以抵消或者削减不同信道和采集设备对说话人语音产生的干扰,增强了说话人识别系统对于不同环境的适应能力。机器人有着广阔的应用前景,面向家庭服务的机器人更是未来千家万户的强烈需求。在本文的最后讨论了一款面向家庭服务的机器人——“睿宝”机器人系统中的说话人识别模块,该模块内嵌于机器语音交互子系统中,在机器人与用户进行语音交互的过程中,对交互对象进行身份辨识和命令合法性确认的工作,很大程度上提高了机器人的安全性和智能性。
|
全文目录
摘要 5-6 Abstract 6-7 第一章 引言 7-14 1.1 说话人识别技术 8-9 1.2 应用领域 9-10 1.3 技术分类 10-11 1.4 研究现状 11-12 1.5 论文工作与组织安排 12-14 第二章 说话人识别基础知识 14-23 2.1 语言的基本过程 14-16 2.2 基本处理过程 16-17 2.3 核心关键问题 17-21 2.4 评分标准 21-22 2.5 小结 22-23 第三章 MFCC特征 23-29 3.1 梅尔尺度 24-25 3.2 MFCC及特征提取 25-28 3.3 小结 28-29 第四章 基于混合高斯模型的说话人识别 29-43 4.1 高斯混合模型 30-32 4.2 基于GMM的说话人模型 32-35 4.3 基于GMM的说话人识别过程 35-36 4.4 基于GMM_UBM的通用背景模型 36-40 4.5 基于GMM_UBM的说话人模型训练 40-41 4.6 基于GMM_UBM模型的识别过程 41-42 4.7 小结 42-43 第五章 复杂信道下说话人识别 43-52 5.1 信道的影响 43-44 5.2 信道鲁棒算法 44-46 5.3 模型域的信道鲁棒算法 46-50 5.4 分数域的信道鲁棒算法 50-51 5.5 小结 51-52 第六章 面向家用机器人的说话人识别系统 52-59 6.1 家用机器人中的说话人识别 52-53 6.2 系统框架及改进方案 53-56 6.3 实验结果 56-58 6.4 小结 58-59 第七章 总结与展望 59-60 攻读硕士学位期间的科研成果 60-61 参考文献 61-64 致谢 64-65
|
相似论文
- 复杂场景中运动目标的检测与跟踪,TP391.41
- 运动目标检测与跟踪的研究,TP391.41
- 视频监控系统中的运动目标检测算法研究,TP391.41
- 嵌入式目标检测与跟踪系统设计及算法实现,TP391.41
- 基于粒子滤波与Mean Shift平滑运动跟踪的研究与实现,TP391.41
- 分布式声源定位与跟踪算法研究,TN912.3
- 基于VC++6.0的说话人识别系统的研究,TN912.34
- 智能交通视频监控系统中关键技术研究,TP391.41
- 边界防御系统中移动目标跟踪技术研究与实现,TP391.41
- 基于粒子滤波与Mean Shift平滑运动跟踪的研究与实现,TP391.41
- 基于移动网络的智能视频监控系统的设计,TP391.41
- 基于混合特征和高斯混合模型的说话人识别研究,TN912.34
- 基于Windows CE的说话人识别系统的设计与实现,TN912.34
- 说话人识别中特征参数的提取及优化研究,TN912.34
- 基于文本无关的说话人识别研究,TN912.34
- 智能视觉监控中运动目标检测与跟踪的研究,TP391.41
- 基于计算机视觉的目标识别应用技术研发,TP391.41
- 多路并行实时说话人识别算法研究与实现,TN912.34
- 面向高速铁路的轨道异物检测研究,U216.3
- 视频监控中运动目标检测与跟踪算法的研究,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|