学位论文 > 优秀研究生学位论文题录展示
基于BP神经网络的语音情感识别算法的研究
作 者: 颜才柄
导 师: 王虹
学 校: 武汉理工大学
专 业: 信号与信息处理
关键词: 人机交互 语音情感 情感声学特征 BP神经网络
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 233次
引 用: 1次
阅 读: 论文下载
内容摘要
语音是人类交流的重要手段,是相互传递信息中最方便、最基本和最直接的途径。语音信号在传达语义信息的同时,还传递着情感信息,而情感在人们的交流中起着重要的角色。因此,随着人机交互技术的快速发展,语音信号中的情感信息正越来越受到研究人员的重视,特别是在语音合成和语音识别等领域。长期以来情感智能研究只存在于心理学和认知科学等领域,但是近年来随着信息技术的高速发展和人类与计算机关系的日益密切,如何实现计算机的拟人化,能感知周围的环境、情感等内容,已成为了人机交互能力的重要标志和目标。情感智能和计算机技术的结合使之产生了情感识别这一崭新的研究课题。语音信号的情感识别也可以看作是模式识别的问题,研究者通常会提取很多语音特征作为情感特征,将提取的语音特征输入到分类器进行情感识别。论文重点研究了基于BP神经网络的语音情感识别。主要研究内容如下:(1)语音信号的前端处理。对情感语句进行了有效的预加重、加窗和端点检测处理,研究了短时过零率和短时能量的提取方法,比较和分析了基音周期的估计算法,通过研究前人提出的方法改进了基音周期估计算法。(2)语音情感特征参数的分析和提取。对大量的情感语句的特征变化规律进行了统计分析,研究了与情感相关的特征信息,确定了用于语音情感识别的16个特征值,并组成了16维特征向量,包括:第一共振峰、第二共振峰、第三共振峰的最大值、最小值和平均值;平均短时过零率的最大值;基音频率的均值,最大值和最小值以及短时能量的最大值、最小值和平均值。(3)由于提取的特征矢量是高维的,而且具有一定的相关性,即存在一定的冗余。因此本文对神经网络训练集中的样本作了归一化处理,然后作了主成分分析,既降低了输入的特征矢量的维数,同时也去除了冗余信息。本文还分析了BP神经网络的结构、原理和存在的缺点,在MATLAB6.5实验环境中,将两种改进的BP算法用于识别语音情感,与传统的BP算法相比,改进的BP算法无论从识别率还是收敛速度上都有了一定的提高。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-14 1.1 语音情感识别的研究背景 9-10 1.2 语音情感识别的意义和应用价值 10-11 1.3 语音情感识别研究发展现状 11-12 1.4 论文的主要工作和内容安排 12-14 第2章 语音信号的前端处理 14-27 2.1 引言 14 2.2 语音信号的预处理 14-20 2.2.1 语音信号的的预加重 14-15 2.2.2 语音信号的加窗 15-17 2.2.3 语音信号的端点检测 17-20 2.3 基音周期的估计 20-26 2.3.1 基音周期估计概述 21-22 2.3.2 本文采用的基音周期估计算法 22-26 2.4 小结 26-27 第3章 语音情感特征参数的选择和提取 27-36 3.1 情感的分类 27 3.2 语音情感特征参数的分析和提取 27-35 3.2.1 振幅和能量特征分析 28-29 3.2.2 基音频率分析 29-31 3.2.3 共振峰特征分析 31-35 3.3 小结 35-36 第4章 基于BP神经网络的语音情感识别 36-52 4.1 BP神经网络算法及改进 36-40 4.1.1 BP神经网络的结构 37 4.1.2 BP神经网络的标准算法 37-38 4.1.3 BP神经网络算法的改进 38-40 4.2 语音情感识别的仿真实验与分析 40-51 4.2.1 语音情感数据库的选择 40-41 4.2.2 语音情感识别流程 41-42 4.2.3 语音情感特征参数的选择 42 4.2.4 用于语音情感识别的BP网络的设计 42-44 4.2.5 实验与分析 44-51 4.3 结论 51-52 第5章 总结和展望 52-54 5.1 总结 52-53 5.2 展望 53-54 参考文献 54-57 致谢 57-58 攻读硕士学位发表论文和参加科研情况 58
|
相似论文
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 机械臂视觉伺服系统的研究,TP242.6
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 高速公路拆迁民众生存系统评价研究,D523
- 数字电视互动应用交互系统设计与实现,TP311.52
- 基于多重分形的语音情感识别研究,TN912.34
- 语音情感识别的特征选择与特征产生,TP18
- 煤矿风险信息集成与智能预警研究,X936
- 基于计算机视觉的柑橘品质分级技术研究,TP391.41
- 全新的交互体验,TP11
- 基于模拟的注塑模浇注系统及成型工艺参数优化研究,TQ320.662
- 基于神经网络的漯河技术监督局食品安全预警系统研究,F203
- 基于神经网络的自适应噪声主动控制研究,TP183
- 数字型仪表自动识读系统研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 多向变异遗传算法及其优化神经网络的研究,TP18
- 基于因子分析和BP神经网络的风机状态诊断研究,F426.61
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|