学位论文 > 优秀研究生学位论文题录展示

基于多重分形的语音情感识别研究

作 者: 张密霞
导 师: 叶吉祥
学 校: 长沙理工大学
专 业: 计算机应用技术
关键词: 语音情感识别 语音情感特征 多重分形 广义Hurst指数
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 8次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着科学技术的快速发展,新型的人机交互(Human Machine Interaction, HMI)技术逐渐成为当前计算机科学领域的研究热点。语音情感识别的研究对于增强计算机的人性化和智能化,建立新型人机交互环境等具有重要的现实意义,并将产生很好的经济和社会效益。本文首先简述了课题的研究背景及文中的主要研究内容,回顾并分析了现阶段国内外语音情感识别中涉及的几个关键技术,包括情感的分类、情感语料库的建立、语音情感特征提取以及情感分类算法等。在此基础上,采用多重分形理论分析语音信号在高兴、生气、悲伤和平静4种不同情感状态下的混沌特性,进而提取了多重分形谱特征和广义Hurst指数作为新的情感特征参数参加语音情感识别。具体内容如下:(1)基于柏林实验室的德语语料库EMO-DB,观察并分析了在高兴、生气、悲伤和平静四种情感状态下,语音信号的基频、能量振幅、过零率、共振峰以及Mel倒谱系数MFCC等特征的变化规律。(2)提出了基于多重分形的语音情感特征参数的提取方法。介于传统情感语音特征缺乏对语音混沌特性的表征,采用多重分形理论通过分析不同语音情感状态下的多重分形特征,提取多重分形谱参数和广义Hurst指数作为新的语音情感特征参数。多重分形特征的引入,弥补了传统线性特征在刻画不同情感类型特征上的不足。(3)根据多重分形对将强度较高的情感(高兴和生气)与强度较低的情感(悲伤和平静)有良好区分度的特性,通过建立SVM二叉树的中间节点,实现对情感类别间的粗分类,保证了将容易混淆的情感类别划归为一组,以便深入分析不同情感状态之间的细微差别。进而采用贡献最大的特征矢量对中间节点上的每组情感再进行分类,其贡献值的确定由经验而得。最后,实现了较为理想的基于经验性特征的SVM二叉树语音情感识别。

全文目录


摘要  5-6ABSTRACT  6-10第一章 绪论  10-16  1.1 选题背景及意义  10  1.2 国内外研究现状  10-12    1.2.1 语音情感识别研究现状  10-11    1.2.2 多重分形发展动态  11-12  1.3 语音情感识别概述  12-15    1.3.1 语音情感特征提取  12-14    1.3.2 特征选择  14    1.3.3 语音情感识别  14-15  1.4 论文组织结构  15-16第二章 语音情感传统特征的分析与提取  16-24  2.1 情感的分类  16  2.2 情感语料库概况  16-18  2.3 语音信号预处理  18-19    2.3.1 预加重  18    2.3.2 分帧加窗  18-19  2.4 传统语音情感特征参数的分析与提取  19-23    2.4.1 基音频率  19-20    2.4.2 能量幅度  20-21    2.4.3 短时过零率  21    2.4.4 共振峰  21-22    2.4.5 MFCC  22-23  2.5 本章小结  23-24第三章 多重分形及其在情感语音中的分析  24-33  3.1 分形理论  24  3.2 多重分形  24-26    3.2.1 多重分形定义  24-25    3.2.2 多重分形过程  25-26  3.3 广义Hurst 指数的估计  26-27  3.4 尺度函数τ( q) 、奇异指数a 及多重分形谱f ( a ) 之间的关系  27  3.5 语音情感多重分形分析  27-32    3.5.1 广义Hurst 指数的估计  29-30    3.5.2 多重分形谱分析  30-32  3.6 本章小结  32-33第四章 基于多重分形和 SVM 的语音情感识别  33-42  4.1 支持向量机原理  33-36    4.1.1 最优分类面  33-35    4.1.2 SVM 核函数  35    4.1.3 SVM 多分类算法  35-36  4.2 基于SVM 一对一算法的语音情感识别  36-38    4.2.1 实验步骤及方法  36    4.2.2 实验结果及分析  36-38  4.3 基于二叉树SVM 的语音情感识别  38-41    4.3.1 SVM 二叉树的建立  38-39    4.3.2 基于多重分形的SVM 二叉树粗分类  39    4.3.3 基于经验性选择的SVM 细分类  39-40    4.3.4 实验结果分析与比较  40-41  4.4 小结  41-42第五章 总结与展望  42-43  5.1 全文总结  42  5.2 研究展望  42-43参考文献  43-48致谢  48-49附录(攻读硕士学位期间发表录用论文)  49-50中英文摘要  50-58

相似论文

  1. 语音情感识别的特征选择与特征产生,TP18
  2. 多重分形过程性质研究,F830.91
  3. 基于DCCA和MF-DCCA的步态信号的分析与研究,TN911.6
  4. 中国股票市场多重分形特征及羊群行为关系研究,F832.51
  5. 基于分形理论的中国股市预警机制研究,F832.51
  6. 基于分形理论的我国开放式基金风险度量和业绩评价研究,F832.5;F272
  7. 基于分形理论的安庆气候变化分析,P467
  8. 基于MF-DFA和MF-SSA的心脏病理时间序列分析,O211.61
  9. 农田土壤水盐特性的空间变异性研究,S152
  10. 早搏信号的小波模极大值多重分形分析,R540.41
  11. 脑电信号的多重分形研究,TN911.7
  12. 基于语言混合特征的情感识别研究,TN912.3
  13. 多特征结合的语音情感识别方法研究,TN912.3
  14. 多重分形在股票市场中的应用,F832.51
  15. 股票价格的多重分形分析及其预测研究,F832.51
  16. 基于多分形小波的网络流量模拟系统的研究,TN915.06
  17. 分形理论在交通中的应用,U491
  18. 基于独立分量分析的语音情感识别研究,TN912.34
  19. 随机介质中的分形生长研究,O415.5
  20. 基于分形市场理论的封闭式基金业绩和风险评价研究,F832.5

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com