学位论文 > 优秀研究生学位论文题录展示
面向说话人识别的SVM核方法对比研究
作 者: 余奇
导 师: 杨莹春
学 校: 浙江大学
专 业: 计算机软件与理论
关键词: 说话人识别 支持向量机 核函数 线性区分核 概率距离核 超向量核 Fisher核 偏差核
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 43次
引 用: 0次
阅 读: 论文下载
内容摘要
说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别出说话人的过程,它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景。支持向量机是在统计学习理论上发展出来的一种模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。由于支持向量机具有坚实的理论基础,引起越来越多的人们关注,近年来,支持向量机在说话人识别中的应用日益广泛。支持向量机作为说话人识别模型分为基于帧的和基于语句的两种方式。基于语句的说话人支持向量机模型重点在于核函数的构造,核函数是一种语句间相似度的描述工具,在实现上它通常表现为两条语句间的距离,在形式上它是多种多样的,可以是内积形式,也可以是距离,还可以是模型得分。目前核函数的构造往往是采用试探性实验的方式进行的,缺乏对构造思想以及其合理性的详细分析,因此,对不同核函数的构造思想及过程进行分析,有助于加深对核函数意义的理解,并为构造新的核提供借鉴思路。论文首先给出了一种通用的核函数构造模式。在此基础上着重对通用线性区分核、概率距离核、超向量核、Fisher核与偏差核这几个核函数进行对比研究,分析它们的构建思想,挖掘其内在的合理性,找出它们相互间的区别与联系。具体工作包括:1.通用线性区分核函数。对序列核概念、核函数设计的思路与推导、映射方式以及训练算法等作了细致的分析,并进行实验验证;2.概率距离核和超向量核。对两种核函数的构造方法与推导、映射的涵义以及两者之间的区别与联系进行详细分析与实验研究;3.Fisher核和偏差核。对两种核函数的构造方法与推导、映射方式和两者之间的区别与联系进行详细分析与实验研究。
|
全文目录
摘要 4-6 Abstract 6-13 第1章 绪论 13-18 1.1 说话人识别概述 13-14 1.2 基于支持向量机的说话人识别 14-15 1.3 研究意义 15-16 1.4 论文主要工作 16-18 第2章 说话人识别 18-24 2.1 说话人系统结构 18-19 2.2 特征提取 19-21 2.2.1 提取过程 19 2.2.2 美尔倒谱特征 19-21 2.3 说话人模型 21-22 2.4 说话人识别性能评价 22-23 2.4.1 等错误率与DET曲线 22-23 2.4.2 检测代价函数 23 2.5 本章小结 23-24 第3章 统计学习与支持向量机 24-40 3.1 机器学习 24-27 3.1.1 学习问题表示 24-26 3.1.2 经验风险最小化 26 3.1.3 复杂性与推广能力 26-27 3.2 统计学习理论核心内容 27-30 3.2.1 VC维的概念 27 3.2.2 推广性的界 27-28 3.2.3 结构风险最小化 28-30 3.3 支持向量机 30-39 3.3.1 内积作为相似性度量工具 30-31 3.3.2 最优分类面 31-33 3.3.3 核方法 33-35 3.3.4 多类分类问题 35-37 3.3.5 核函数构造 37-39 3.4 本章小节 39-40 第4章 通用线性区分序列核(GLDS) 40-53 4.1 序列核 40-41 4.2 映射方式 41-42 4.3 GLDS核构造 42-47 4.3.1 得分函数 42-44 4.3.2 模型训练 44-45 4.3.3 GLDS核 45-47 4.4 GLDS核解析 47-48 4.5 算法描述 48-49 4.6 实验 49-51 4.6.1 NIST2001库 49-50 4.6.2 实验设置 50 4.6.3 GLDS核实验说明 50-51 4.7 本章小结 51-53 第5章 概率距离核与超向量核 53-68 5.1 基于概率模型的核函数 53-54 5.2 概率距离核 54-60 5.2.1 高斯混合模型 54-58 5.2.2 概率距离核 58-60 5.3 超向量核 60-64 5.3.1 通用背景模型 60-61 5.3.2 超向量核函数 61-64 5.4 对于GMM核的理解 64-65 5.5 实验 65-67 5.5.1 概率距离核实验说明 65-66 5.5.2 超向量核实验说明 66-67 5.6 本章小结 67-68 第6章 Fisher核与偏差核 68-77 6.1 Fisher核 68-71 6.1.1 Fisher映射 68-70 6.1.2 Fisher的直观解释 70-71 6.2 偏差核 71-74 6.2.1 基于VQ的偏差核 71-73 6.2.2 基于GMM的偏差核 73-74 6.3 实验 74-76 6.3.1 Fisher实验说明 74-75 6.3.2 偏差核实验说明 75-76 6.4 本章小结 76-77 第7章 总结与展望 77-79 参考文献 79-84 致谢 84
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 地波辐射源的调制类型识别与参数估计,TN957.51
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|