学位论文 > 优秀研究生学位论文题录展示

小词汇量非特定人语音识别系统的研究

作　者: 周卓然
导　师: 徐道连
学　校: 重庆大学
专　业: 仪器科学与技术
关键词: 语音识别端点检测识别算法粒子群—支持向量机图形用户界面
分类号: TN912.34
类　型: 硕士论文
年　份: 2012年
下　载: 229次
引　用: 0次
阅　读: 论文下载

内容摘要

语音识别是指使计算机能够“听懂”人类的语言，并且理解语言的内容执行特定的命令或任务。作为人机交互技术的基础，其最终目的是实现人与机器的自然交流。语音识别应用的领域非常广泛，其中，非特定人、小词汇量语音识别系统是语音识别应用领域中的一个重要分支。本文主要针对非特定人、小词汇量的语音识别识别系统进行了深入研究，并在此基础上编写非特定人小词汇量语音识别软件，主要工作如下：(1)通过分析传统端点检测算法的缺点提出了一种改进型端点检测算法——自适应双门限语音端点检测算法，仿真表明该算法具有更好的性能；分析语音识别中三种不同的特征参数：线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)以及功率归一化倒谱系数(PNCC)。(2介绍了目前三种主流的语音识别算法：动态时间规整(DTW)、隐马尔科夫模型(HMM)和支持向量机(SVM)，分析了它们的原理、特点及实现过程，以及目前主流语音识别算法的局限性和不足。使用DTW算法和HMM算法，构建了两个小型语音识别系统，通过实验分析了如何选取HMM模型的参数并比较了DTW算法和HMM算法的适用范围。(3)分析了基于统计学习理论的语音识别算法——支持向量机算法，对该算法的基本原理以及使用该算法实现语音识别的流程进行了介绍，对支持向量机（SVM）的不同核函数进行分析，选用了RBF核函数，并实验分析了核函数参数及惩罚因子对语音识别的影响。(4)对于如何选取核函数参数及惩罚因子，传统的方法都是通过反复实验比对以及根据人为经验选择，此方法并不科学，由于对识别效果影响重大，因此本文进行了初步的研究，提出使用粒子群算法优化支持向量机参数算法，即PSO—SVM算法。使用MATLAB的GUIDE，用GUI的形式实现了基于PSO—SVM的语音识别系统，通过实验验证了该算法的有效性，在系统样本有限的情况下，该系统比HMM算法和未使用优化算法的SVM算法语音识别率要有所提高。(5)考虑到硬件条件和算法特点，选取DTW算法作为硬件语音识别算法。实现了以SPCE061A单片机为核心的小型嵌入式语音识别系统，介绍了硬件组成及软件部分，通过测试，证明测试结果较理想。

全文目录

摘要  3-4
Abstract  4-9
1 绪论  9-13
  1.1 引言  9
  1.2 语音识别发展历程  9-11
  1.3 语音识别研究面临的难点  11
  1.4 本课题研究的目的和意义  11-12
  1.5 本文的研究工作及组织安排  12-13
2 语音识别的基础理论  13-33
  2.1 语音识别的基本原理  13
  2.2 语音信号的预处理  13-17
    2.2.1 语音信号采样、A/D 转换  14-15
    2.2.2 语音信号的预加重  15-16
    2.2.3 语音信号加窗和分帧  16-17
  2.3 语音端点检测算法实现及改进  17-24
    2.3.1 短时平均能量和短时平均过零率  18
    2.3.2 传统的双门限端点检测算法  18-20
    2.3.3 对双门限端点检测算法的改进  20-24
  2.4 特征参数的提取  24-31
    2.4.1 线性预测系数（LPC）  24
    2.4.2 线性倒谱系数（LPCC）  24-26
    2.4.3 美尔频率倒谱系数（MFCC）  26-29
    2.4.4 功率归一化倒谱系数（PNCC）  29-31
  2.5 本章总结  31-33
3 常用语音识别算法分析  33-57
  3.1 DTW（动态时间规整）技术  33-38
  3.2 隐马尔科夫模型（HMM）  38-43
    3.2.1 HMM 的定义  38
    3.2.2 HMM 的数学描述  38-39
    3.2.3 HMM 在语音识别的运用  39-40
    3.2.4 使用 HMM 需要解决的三个问题及相关算法  40-43
    3.2.5 HMM 拓扑形式和状态个数以及分类  43
  3.3 支持向量机（SVM）  43-44
  3.4 三种算法的优缺点对比  44
  3.5 HMM 算法实验仿真结果及分析  44-55
    3.5.1 语音样本库的建立  45
    3.5.2 基于 HMM 算法的语音识别系统说明  45-46
    3.5.3 系统编程流程  46-53
    3.5.4 实验结果及分析  53-55
  3.6 本章总结  55-57
4 支持向量机在语音识别中的应用  57-67
  4.1 传统模式识别方法的不足  57
  4.2 统计学习理论  57-59
    4.2.1 经验风险最小化原则  58
    4.2.2 结构风险最小化原则  58-59
  4.3 支持向量机理论（support vector machine,SVM）  59-63
    4.3.1 线性最优分类面  59-60
    4.3.2 线性支持向量机  60
    4.3.3 非线性支持向量机  60-62
    4.3.4 支持向量机的实现  62
    4.3.5 支持向量机的核函数  62-63
  4.4 实验结果及分析  63-66
    4.4.1 实验一不同核函数对 SVM 识别效果的影响  64-65
    4.4.2 实验二不同核函数参数对 SVM 识别效果的影响  65-66
  4.5 本章总结  66-67
5 用粒子群算法优化支持向量机参数  67-87
  5.1 粒子群优化算法  67-70
    5.1.1 基本 PSO 算法（全局版）  67
    5.1.2 标准粒子群算法  67-68
    5.1.3 标准粒子群算法流程  68-69
    5.1.4 标准粒子群算法参数分析  69-70
  5.2 基于粒子群算法的 SVM 算法模型参数选择  70-74
    5.2.1 SVM 模型核函数和模型参数的选择  70-71
    5.2.2 PSO-SVM 参数优化算法原理  71-74
  5.3 实验结果及讨论  74-85
    5.3.1 预处理及端点检测  77-80
    5.3.2 单个样本的演示效果  80-82
    5.3.3 多个样本的演示效果  82-85
  5.4 本章总结  85-87
6 嵌入式语音识别系统的构成  87-97
  6.1 系统硬件设计  87-92
  6.2 系统软件设计  92-95
    6.2.1 初始化  92-93
    6.2.2 预处理  93
    6.2.3 特征参数的提取  93
    6.2.4 语音的识别  93-95
  6.3 本章总结  95-97
7 工作总结与展望  97-99
  7.1 工作总结  97-98
  7.2 后续工作与展望  98-99
致谢  99-101
参考文献  101-105
附录  105
  A 作者在攻读学位期间发表的论文目录  105

小词汇量非特定人语音识别系统的研究

内容摘要

全文目录

相似论文