学位论文 > 优秀研究生学位论文题录展示
基于多重分形的语音情感识别研究
作 者: 张密霞
导 师: 叶吉祥
学 校: 长沙理工大学
专 业: 计算机应用技术
关键词: 语音情感识别 语音情感特征 多重分形 广义Hurst指数
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 8次
引 用: 0次
阅 读: 论文下载
内容摘要
随着科学技术的快速发展,新型的人机交互(Human Machine Interaction, HMI)技术逐渐成为当前计算机科学领域的研究热点。语音情感识别的研究对于增强计算机的人性化和智能化,建立新型人机交互环境等具有重要的现实意义,并将产生很好的经济和社会效益。本文首先简述了课题的研究背景及文中的主要研究内容,回顾并分析了现阶段国内外语音情感识别中涉及的几个关键技术,包括情感的分类、情感语料库的建立、语音情感特征提取以及情感分类算法等。在此基础上,采用多重分形理论分析语音信号在高兴、生气、悲伤和平静4种不同情感状态下的混沌特性,进而提取了多重分形谱特征和广义Hurst指数作为新的情感特征参数参加语音情感识别。具体内容如下:(1)基于柏林实验室的德语语料库EMO-DB,观察并分析了在高兴、生气、悲伤和平静四种情感状态下,语音信号的基频、能量振幅、过零率、共振峰以及Mel倒谱系数MFCC等特征的变化规律。(2)提出了基于多重分形的语音情感特征参数的提取方法。介于传统情感语音特征缺乏对语音混沌特性的表征,采用多重分形理论通过分析不同语音情感状态下的多重分形特征,提取多重分形谱参数和广义Hurst指数作为新的语音情感特征参数。多重分形特征的引入,弥补了传统线性特征在刻画不同情感类型特征上的不足。(3)根据多重分形对将强度较高的情感(高兴和生气)与强度较低的情感(悲伤和平静)有良好区分度的特性,通过建立SVM二叉树的中间节点,实现对情感类别间的粗分类,保证了将容易混淆的情感类别划归为一组,以便深入分析不同情感状态之间的细微差别。进而采用贡献最大的特征矢量对中间节点上的每组情感再进行分类,其贡献值的确定由经验而得。最后,实现了较为理想的基于经验性特征的SVM二叉树语音情感识别。
|
全文目录
摘要 5-6ABSTRACT 6-10第一章 绪论 10-16 1.1 选题背景及意义 10 1.2 国内外研究现状 10-12 1.2.1 语音情感识别研究现状 10-11 1.2.2 多重分形发展动态 11-12 1.3 语音情感识别概述 12-15 1.3.1 语音情感特征提取 12-14 1.3.2 特征选择 14 1.3.3 语音情感识别 14-15 1.4 论文组织结构 15-16第二章 语音情感传统特征的分析与提取 16-24 2.1 情感的分类 16 2.2 情感语料库概况 16-18 2.3 语音信号预处理 18-19 2.3.1 预加重 18 2.3.2 分帧加窗 18-19 2.4 传统语音情感特征参数的分析与提取 19-23 2.4.1 基音频率 19-20 2.4.2 能量幅度 20-21 2.4.3 短时过零率 21 2.4.4 共振峰 21-22 2.4.5 MFCC 22-23 2.5 本章小结 23-24第三章 多重分形及其在情感语音中的分析 24-33 3.1 分形理论 24 3.2 多重分形 24-26 3.2.1 多重分形定义 24-25 3.2.2 多重分形过程 25-26 3.3 广义Hurst 指数的估计 26-27 3.4 尺度函数τ( q) 、奇异指数a 及多重分形谱f ( a ) 之间的关系 27 3.5 语音情感多重分形分析 27-32 3.5.1 广义Hurst 指数的估计 29-30 3.5.2 多重分形谱分析 30-32 3.6 本章小结 32-33第四章 基于多重分形和 SVM 的语音情感识别 33-42 4.1 支持向量机原理 33-36 4.1.1 最优分类面 33-35 4.1.2 SVM 核函数 35 4.1.3 SVM 多分类算法 35-36 4.2 基于SVM 一对一算法的语音情感识别 36-38 4.2.1 实验步骤及方法 36 4.2.2 实验结果及分析 36-38 4.3 基于二叉树SVM 的语音情感识别 38-41 4.3.1 SVM 二叉树的建立 38-39 4.3.2 基于多重分形的SVM 二叉树粗分类 39 4.3.3 基于经验性选择的SVM 细分类 39-40 4.3.4 实验结果分析与比较 40-41 4.4 小结 41-42第五章 总结与展望 42-43 5.1 全文总结 42 5.2 研究展望 42-43参考文献 43-48致谢 48-49附录(攻读硕士学位期间发表录用论文) 49-50中英文摘要 50-58
|
相似论文
- 语音情感识别的特征选择与特征产生,TP18
- 多重分形过程性质研究,F830.91
- 基于DCCA和MF-DCCA的步态信号的分析与研究,TN911.6
- 中国股票市场多重分形特征及羊群行为关系研究,F832.51
- 基于分形理论的中国股市预警机制研究,F832.51
- 基于分形理论的我国开放式基金风险度量和业绩评价研究,F832.5;F272
- 基于分形理论的安庆气候变化分析,P467
- 基于MF-DFA和MF-SSA的心脏病理时间序列分析,O211.61
- 农田土壤水盐特性的空间变异性研究,S152
- 早搏信号的小波模极大值多重分形分析,R540.41
- 脑电信号的多重分形研究,TN911.7
- 基于语言混合特征的情感识别研究,TN912.3
- 多特征结合的语音情感识别方法研究,TN912.3
- 多重分形在股票市场中的应用,F832.51
- 股票价格的多重分形分析及其预测研究,F832.51
- 基于多分形小波的网络流量模拟系统的研究,TN915.06
- 分形理论在交通中的应用,U491
- 基于独立分量分析的语音情感识别研究,TN912.34
- 随机介质中的分形生长研究,O415.5
- 基于分形市场理论的封闭式基金业绩和风险评价研究,F832.5
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|