学位论文 > 优秀研究生学位论文题录展示
基于独立分量分析的语音情感识别研究
作 者: 梁智兰
导 师: 李雪耀
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 语音情感识别 情感特征 独立分量分析 支持向量机
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 88次
引 用: 0次
阅 读: 论文下载
内容摘要
随着人机交互系统的快速发展,语音信号中的情感信息近几年来越来越受到人们的重视,特别是在语音合成和语音识别领域。语音情感识别的研究对于增强计算机的智能化和人性化,开发新型人机环境,以及推动心理学等学科的发展,有着重要的现实意义,并最终产生很大经济效益和社会效益。本文的研究目的就是通过深入分析各种语音情感特征,找出其中对情感识别有效的特征,并寻找适合的模型对语音情感分类。语音情感识别主要包含四个方面:语音情感分类、语音情感数据库建立、语音情感特征参数提取和语音情感识别。通过对国内外相关研究的了解,本文将语音情感分为高兴悲伤愤怒和惊奇四类并建立了一个Speaker-Dependent的小规模汉语语音情感数据库。从语音信号中提取了基于基音频率、振幅能量、语速和共振峰和Mel频带子带能量等相关的统计特征参数。然而初始提取的特征参数组成的输入特征矢量通常具有一定的相关性,即存在一定的冗余。因此本文对提取的特征参数作了独立分量分析。经过独立分量分析算法,去除了特征矢量之间的相关性,即去除了特征矢量之间的冗余。然后用支持向量机的方法对语音情感进行识别。最后,给出了识别结果和实验分析,并讨论了该领域存在的一些问题和今后所需的进一步研究。
|
全文目录
摘要 5-6 ABSTRACT 6-9 第1章 绪论 9-14 1.1 研究意义 9 1.2 语音情感识别研究涉及的领域及应用 9-11 1.3 国内外语音情感识别技术研究现状 11-12 1.4 研究内容与章节安排 12-14 1.4.1 主要研究内容 12-13 1.4.2 章节安排 13-14 第2章 语音产生机理、情感分类和数据库建立 14-20 2.1 语音情感的定义及分类 14-16 2.2 语音情感数据库的建立 16-19 2.2.1 情感语句选择 17-18 2.2.2 情感语句录音 18-19 2.3 本章小结 19-20 第3章 语音情感特征参数的分析提取 20-34 3.1 语音信号预处理 20-22 3.1.1 语音信号的采样和量化 20 3.1.2 语音信号的预加重处理 20-21 3.1.3 语音信号的加窗分帧处理 21-22 3.2 语音情感特征分析 22-23 3.3 语音情感特征参数提取 23-33 3.3.1 语速的提取 23-24 3.3.2 基音频率参数的提取 24-26 3.3.3 振幅能量参数的提取 26-27 3.3.4 共振峰参数的提取 27-32 3.3.5 美尔子带能量参数的提取 32-33 3.4 本章小结 33-34 第4章 语音情感特征的独立分量分析 34-42 4.1 独立分量分析概述 34 4.2 独立分量分析算法定义 34-35 4.3 FastICA算法 35-39 4.3.1 FastICA预处理 36 4.3.2 FastICA算法原理 36-38 4.3.3 FastICA的优良特性 38-39 4.4 基于独立分量分析的特征提取 39-40 4.5 本章小结 40-42 第5章 基于SVM的语音情感识别 42-59 5.1 常用的语音情感识别技术 42-46 5.1.1 主成分分析方法(PCA) 42-43 5.1.2 人工神经网络 43-44 5.1.3 隐马尔可夫模型 44-45 5.1.4 高斯混合模型 45-46 5.2 统计学习与支持向量机理论 46-54 5.2.1 统计学习理论 46-49 5.2.2 支持向量机理论 49-54 5.3 基于SVM的仿真试验及分析 54-57 5.3.1 独立分量分析前的情感识别 55-56 5.3.2 独立分量分析后的情感识别 56-57 5.4 本章小结 57-59 结论 59-60 参考文献 60-64 攻读硕士学位期间发表的论文和取得的科研成果 64-65 致谢 65
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于多重分形的语音情感识别研究,TN912.34
- 语音情感识别的特征选择与特征产生,TP18
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|