学位论文 > 优秀研究生学位论文题录展示
与文本无关的说话人确认系统的信道鲁棒性研究
作 者: 巢建树
导 师: 邱意弘;黄伟
学 校: 上海交通大学
专 业: 生物医学工程
关键词: 特征参数 说话人确认 高斯混合模型 支持向量机 信道鲁棒性
分类号: TP391.42
类 型: 硕士论文
年 份: 2009年
下 载: 92次
引 用: 1次
阅 读: 论文下载
内容摘要
说话人确认是判断待识别的说话人语音是否与他所申明的身份相符的一种生物识别技术。该技术广泛地应用于语音门禁系统、电话银行系统、数据库访问等身份验证领域。虽然说话人确认在干净的语音环境中已经取得了令人满意的结果,但是在信道或者噪声干扰的情况下,其识别率就会大大下降。因此本文着重研究了与文本无关的说话人确认系统,从参数级、模型级、系统级三个方面加强了系统的信道鲁棒性。主要有以下内容:一.详细分析了语音的参数特征以及提取方法,实现了各种参数级鲁棒性算法。二.在目前最为成功的UBM-GMM系统上,实现了十分优秀的隐藏因子分析(LFA)信道鲁棒性算法,提高了系统的识别性能。三.详细分析了支持向量机(SVM)的理论基础,将其引入说话人确认系统中并获得了良好的性能。实现了近几年来在该系统上使用的非常有效的信道鲁棒算法NAP。四.为了进一步提高系统的识别性能,研究了系统的融合方法。本文提出了一个基于基音的辅助系统与MFCC主系统结合的方法。最后,对于所有的子系统进行了融合得到了最优鲁棒性的系统。课题中使用了美国国家标准技术局(NIST)说话人识别评测的标准语音数据库以及评测标准,该语音库是在各种电话和手机传输通道、麦克风通道下录制的。本课题的实验验证了上述算法的有效性,基于这些算法的系统具有实用化价值。
|
全文目录
摘要 3-5 ABSTRACT 5-10 第一章 绪论 10-18 1.1 课题研究背景 10-11 1.2 说话人识别概述 11-17 1.2.1 说话人识别基本原理 11-12 1.2.2 说话人识别类型 12-13 1.2.3 评测数据库与评测标准 13-17 1.3 本文主要研究内容 17-18 第二章 特征参数提取和参数级鲁棒性研究 18-32 2.1 语音的发声机理及其模型 18-20 2.2 语音信号的特征参数 20-26 2.2.1 基音周期 21-22 2.2.2 MFCC 参数 22-25 2.2.3 PLP 参数 25-26 2.3 参数级鲁棒性研究 26-31 2.3.1 动态参数法 26-27 2.3.2 倒谱均值相减法(CMS) 27-28 2.3.3 倒谱均值与方差归一化法(CMVN) 28 2.3.4 RASTA 28-29 2.3.5 特征弯折(Feature Warping) 29-31 2.4 本章小结 31-32 第三章 基于高斯混合模型的说话人确认系统 32-45 3.1 高斯混合模型(GMM) 32-36 3.1.1 基本概念 32-34 3.1.2 模型参数的估计 34-36 3.2 基于UBM-GMM 的系统 36-39 3.2.1 UBM-GMM 的训练过程 36-38 3.2.2 UBM-GMM 的识别过程 38-39 3.3 基于LFA 的鲁棒性研究 39-42 3.3.1 超向量(Supervector)的基本概念 39-40 3.3.2 隐藏因子分析(LFA) 40-42 3.4 实验与讨论 42-44 3.4.1 数据库描述 42 3.4.2 参数提取 42-43 3.4.3 实验结果与分析 43-44 3.5 本章小结 44-45 第四章 基于支持向量机的说话人确认系统 45-71 4.1 支持向量机(SVM) 45-58 4.1.1 概述 45 4.1.2 基于风险最小的机器学习方法 45-48 4.1.3 线性判决边界 48-53 4.1.4 非线性判决边界 53-55 4.1.5 核函数 55-58 4.2 SVM 在说话人确认中的应用 58-64 4.2.1 概述 58-59 4.2.2 GMM-SVM 系统 59-62 4.2.3 GMM supervector 系统 62-64 4.3 基于NAP 的鲁棒性研究 64-66 4.4 实验与讨论 66-70 4.4.1 基于SVM 各系统的实验结果 66-68 4.4.2 NAP 鲁棒性的实验结果 68-70 4.5 本章小结 70-71 第五章 系统融合 71-82 5.1 激励源系统及其融合 71-77 5.1.1 概述 71-72 5.1.2 Pitch 超向量系统 72-74 5.1.3 Pitch 超向量和MFCC 超向量的系统融合 74-77 5.2 各子系统融合 77-81 5.2.1 实验条件描述 77-78 5.2.2 实验结果与分析 78-81 5.3 本章小结 81-82 第六章 全文总结 82-84 6.1 主要结论 82-83 6.2 研究展望 83-84 参考文献 84-88 攻读硕士学位期间已发表或录用的论文 88-89 致谢 89-92 上海交通大学学位论文答辩决议书 92
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com
|