学位论文 > 优秀研究生学位论文题录展示

语谱图用于特定人组小词汇量识别算法的研究

作 者: 张悦
导 师: 王双维
学 校: 东北师范大学
专 业: 电路与系统
关键词: 语谱图 形态学图像处理 图像行互相关 共振峰 支持向量机(SVM) 特定人组小词汇量的语音识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2013年
下 载: 29次
引 用: 0次
阅 读: 论文下载
 

内容摘要


特定人小词汇量的识别是语音识别中常见的一种,但它在车载语音方面的应用有很多,其主要应用之一是控制小车的基本动作。它的优点在于能够提高车载语音系统对说话人语音信号响应的准确度以及响应速率。本文在简单介绍了常用的语音识别的算法基础上,提出了一种基于语谱图的特定人组小词汇量识别的算法。该算法未采用以往语音识别算法对语音信号的逐帧识别,而是利用语谱图的整体特性逐字逐词进行语音识别,能够突显语音信号的整体时频特性,将图像处理技术应用到语音识别领域。本文研究的算法主要是用MATLAB7.1软件编程和仿真完成的。首先将在实验室录制好的语音信号经过语音预处理后,分别转换成傅里叶语谱图,利用形态学图像处理技术对语谱图进行平滑、归一化、二值化等预处理;再根据语音信号在语谱图中显示的特点,利用改进后的图像进行行互相关算法,即对语谱图做行互相关运算,求出行互相关的最大系数作为语谱图的第一个特征参数,同时对语谱图中显示的亮纹特征(即共振峰)统计其个数,将它作为语谱图的第二个特征参数;然后采用支持向量机(SVM)网络分类算法对上面所得的数据进行预测分析,从而得出特定人组小词汇量的识别率。本文主要对车载语音识别系统的汉语语音控制命令进行语音识别。

全文目录


摘要  4-5
Abstract  5-8
第一章 绪论  8-15
  1.1 语音识别的概述  8-11
    1.1.1 语音识别的发展历史  8-10
    1.1.2 语音识别的分类和应用  10
    1.1.3 语音识别的基本方法  10-11
    1.1.4 语音识别的问题  11
  1.2 语音识别在汽车上的应用  11-12
  1.3 语谱图的研究现状及应用  12-13
  1.4 应用形态学图像处理技术对语谱图进行分析的研究现状  13
  1.5 支持向量机(SVM)的研究现状及应用  13-14
  1.6 论文的研究内容  14-15
第二章 语音样本的采集及其预处理  15-24
  2.1 建立语音样本集  15-16
  2.2 语音样本的预处理  16-19
    2.2.1 预滤波  16
    2.2.2 采样与量化  16-18
    2.2.3 A/D 转换和预加重  18
    2.2.4 分帧加窗  18-19
  2.3 语音信号的时域和频域分析  19-21
    2.3.1 语音信号的时域分析  20
    2.3.2 语音信号的频域分析  20-21
  2.4 语音信号共振峰的估计  21-23
    2.4.1 共振峰的概念  21
    2.4.2 共振峰提取的方法  21-23
  2.5 本章小结  23-24
第三章 语谱图的分析与显示  24-32
  3.1 语谱图  24
  3.2 语谱图的产生机理  24-31
    3.2.1 语谱图的转换流程及算法  25-26
    3.2.2 语谱图的显示与分析  26-28
    3.2.3 语谱图的预处理  28-31
  3.3 本章小结  31-32
第四章 对语谱图特征参数提取的算法  32-38
  4.1 归一化互相关图像算法  32-34
    4.1.1 归一化互相关定义  32
    4.1.2 归一化的行互相关图像算法  32-34
  4.2 共振峰个数的统计  34-37
  4.3 本章小结  37-38
第五章 支持向量机(SVM)与分类算法  38-56
  5.1 统计学习理论简介  38-40
  5.2 分类问题  40
  5.3 支持向量分类算法(SVC)及模型  40-45
    5.3.1 线性可分情形  40-42
    5.3.2 线性不可分  42-44
    5.3.3 支持向量机(SVM)的多分类法  44-45
  5.4 MATLAB 相关的函数  45-47
    5.4.1 程序  45-46
    5.4.2 程序中功能函数及参数说明  46-47
  5.5 支持向量机算法的实现  47-55
  5.6 本章小结  55-56
第六章 结论及展望  56-57
参考文献  57-59
致谢  59

相似论文

  1. 湿法冶金浸出过程建模与优化,TF803.2
  2. 基于SVM-RFE的潜在生物标志物选择算法研究,TP311.13
  3. 基于子带能量比的OSAS筛查,R319
  4. 基于支持向量机的遥感图像几何校正算法研究,TP751;O241.5
  5. 智能化教学中的情感识别方法研究,TP391.41
  6. 高速公路交通安全综合评价和瓶颈问题分析,U492.8
  7. 东乡语元音声学研究,H233
  8. 基于BCI多动作模式的ERD/ERS信号分析及识别方法的研究,TN911.6
  9. 庆阳市西峰区方言声调实验研究,H17
  10. 基于NMF-SVM的过程建模与监测方法研究,TP274
  11. 基于对象语义的图像检索,TP391.41
  12. 基于切分的汉语连续语音识别技术研究,TN912.34
  13. 基于支持向量机的地球同步轨道相对论电子事件预报方法研究,P353
  14. 支持向量机结合X11季节调整方法用于短期电力负荷预测,TP18
  15. 初级水平缅甸学生汉语元音习得的声学研究,H195
  16. 基于VSM模型和特征选择算法的中文文本自动分类研究,TP391.1
  17. 救援直升机航迹规划研究,V249.1
  18. 基于支持向量机和K近邻的联合分类研究,TP18
  19. 中文文本分类算法比较研究,TP391.1
  20. 基于支持向量机的故障诊断方法的研究,TH165.3
  21. 基于EMD和支持向量机的齿轮箱故障诊断方法研究,TH165.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com