学位论文 > 优秀研究生学位论文题录展示
基于韵律特征的SVM说话人识别
作 者: 黄肖忠
导 师: 李辉
学 校: 中国科学技术大学
专 业: 电路与系统
关键词: 韵律特征 GMM超矢量 SVM 文本无关说话人识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 126次
引 用: 0次
阅 读: 论文下载
内容摘要
语音信号是用于个人身份确认的一种有效的生物特征,与文本无关的说话人识别的研究也是语音信号处理的一个重要的研究方向,其研究具有重要的理论意义和广泛的应用前景。为了考察最新的相关研发进展,并提供统一的衡量标准,美国国家标准技术研究院(NIST)于1996年起开始主持说话人识别评测。NIST说话人评测代表了说话人识别领域的最高水准,NIST设立了多项评测任务,探索和尝试各种语音条件下的研究方法,并为各个项目指定统一的电话和广播语音(多环境、多通道、大规模说话人)、测试基准、评测规则和标准。其中一个任务是采用长语音进行说话人识别,是为了探索用于与文本无关的说话人识别的语音信号高层次信息而设置的。除了短时倒谱参数,语音中的高层次信息也是一种有效的说话人特征参数,但其通常与文本内容有关,因此研究从信号中提取可用于与文本无关说话人识别的语音高层次特征信息就成了目前研究的焦点。本文对韵律的提取方法及其与区辨模型结合运用于与文本无关的说话人识别进行了探讨。从与文本无关的说话人识别的特点出发,本文先讲述概率统计模型,从文本相关的语音韵律(语音特征随时间变化的轨迹)中提取的特征信息,进行数据压缩、聚类,再利用支持向量机SVM进行区分。文章提出了一种基于小波分析从韵律中提取超音段韵律信息的方法,分别从声道的MFCC轨迹和基频轨迹,时域能量轨迹中进行超音段韵律特征的提取。由MFCC各维参数的近似不相关和声道缓变的特点,MFCC轨迹的韵律特征只以概貌系数来刻画,提取的PMFCC作为主参数,在参数级和由基频F0轨迹的六维韵律特征参数PF0、由时域能量轨迹的六维韵律特征参数PE,组成更加有效的PMFCCFE参数,进而利用支持向量机SVM模型进行区分。在NIST数据库上的实验表明,与传统的短时MFCC的GMM-UBM系统相比,超音段韵律特征PMFCCFE的GMM-SVM系统的EER相对下降了57.9%,MinDCF相对下降了41.4%。显著提高了说话人识别的性能。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-17 1.1 说话人识别的研究意义 9-10 1.2 NIST 说话人评测 10-11 1.3 与文本无关的说话人识别 11-12 1.4 说话人识别的评价标准 12-14 1.4.1 等误识率 12-13 1.4.2 检测函数代价函数 13 1.4.3 DET 曲线 13-14 1.5 本文的研究背景与关键问题 14-15 1.5.1 研究背景 14-15 1.5.2 关键问题 15 1.6 本文的主要研究内容 15-17 第2章 基于 GMM-UBM 的说话人识别原理 17-26 2.1 引言 17-18 2.2 GMM 模型的基本原理 18-22 2.2.1 GMM 模型的基本参数 19-20 2.2.2 GMM 的训练算法(EM 算法) 20-22 2.3 基于GMM-UBM 的说话人识别系统 22-24 2.3.1 GMM-UBM 模型 22-23 2.3.2 特定说话人模型的自适应 23-24 2.4 实验结果 24-26 2.4.1 语料库描述 24-25 2.4.2 实验结果 25-26 第3章 基于区分性辨别模型的说话人识别 26-37 3.1 基于区分性辨别模型的说话人识别 26-33 3.1.1 支持向量机的基本原理 26-29 3.1.2 支持向量机运用于说话人识别 29-33 3.2 GMM 超矢量用于SVM 说话人识别 33-35 3.2.1 特征变换和聚类 33-34 3.2.2 基于GMM 超矢量的SVM 说话人模型 34-35 3.2.3 SVM 模型的评分 35 3.3 实验结果 35-36 3.4 本章小结 36-37 第4章 超音段韵律信息的说话人识别 37-54 4.1 引言 37 4.2 特征提取 37 4.3 声道参数MFCC 在说话人识别中的应用 37-40 4.3.1 倒谱分析及MFCC 参数的提取 38 4.3.2 倒谱分析 38 4.3.3 Mel 倒谱参数 38-40 4.4 音源参数pitch 40-42 4.5 语音信号的时域能量 42-43 4.6 韵律参数提取 43-44 4.7 基于小波分析的韵律参数提取 44-50 4.7.1 小波分析基本理论 45-47 4.7.2 小波分析提取Pitch-Contour 参数 47-49 4.7.3 基于小波分析的韵律参数 49-50 4.8 超音段声道韵律特征PMFCC 50-51 4.9 超音段韵律特征PF0 51-52 4.10 超音段韵律特征PE 52 4.11 超音段韵律特征PMFCCFE 的组成 52 4.12 实验结果 52-54 第5章 基于韵律特征的 SVM 说话人识别 54-62 5.1 基于GMM 均值超矢量的SVM 的说话人识别 54-55 5.2 实验结果及分析 55-60 5.2.1 PMFCC、PF0、PE 系统的性能 55-56 5.2.2 不同韵律特征的互补效果 56-57 5.2.3 PMFCCFE 的SVM 系统 57-59 5.2.4 韵律特征的GMM-SVM 系统和基准系统性能比较 59-60 5.3 本章小结 60-62 第6章 总结与展望 62-64 参考文献 64-68 致谢 68-69 在读期间发表的学术论文与取得的研究成果 69
|
相似论文
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于SVM分类算法的主题爬虫研究,TP391.3
- 基于计算机视觉的柑橘品质分级技术研究,TP391.41
- 海南雾的天气气候特征分析及预报方法研究,P457
- 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
- 基于支持向量机的视频目标检测方法研究,TP391.41
- 基于SVM和形状特征的电极三维模型分类检索的研究,TP391.41
- 多特征融合的视觉跟踪算法研究,TP391.41
- 基于多普勒气象雷达的风切变预测研究,P415.2
- 基于本体的医学命名实体识别技术研究,TP391.1
- 电动汽车驱动控制系统的研究,U469.72
- 基于稀疏表达的人脸识别算法研究,TP391.41
- 基于SVM-RFE的潜在生物标志物选择算法研究,TP311.13
- 基于PCA和SVM的汽车涂装线机电设备智能诊断,TH165.3
- 定量构效关系和分子对接在药物分析化学中的应用,R917
- 综合多特征和SVM相关反馈的藻类图像检索技术研究,TP391.41
- 基于支持向量机的烟气成分建模研究,TK224.11
- 旅游景区经营权价格评估探索,F592
- 普通话的态度语音韵律研究,H116
- 母语为英语的留学生汉语二字组韵律偏误研究,H195
- 多特征结合的语音情感识别方法研究,TN912.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|