学位论文 > 优秀研究生学位论文题录展示

汉语连续语音声调及数字串识别系统的研究

作　者: 严欢
导　师: 殷景华
学　校: 哈尔滨理工大学
专　业: 微电子学与固体电子学
关键词: 语音识别声调识别基音周期隐马尔可夫模型
分类号: TN912.34
类　型: 硕士论文
年　份: 2011年
下　载: 26次
引　用: 0次
阅　读: 论文下载

内容摘要

语音识别在人机交互、通信、互联网和工业化控制等方面有着重要应用前景。声调是汉语音节的重要组成部分,具有构词辨意作用。汉语语音识别技术目前的研究热点和难点是非特定人的连续语音。随着语音识别技术的发展,声调识别研究成为其突破的方向之一。本文首先对声调提取算法进行研究。采用基于多参数组合方法(短时能量、短时过零率、自相关函数值)进行语音信号清浊音判别,利用循环平均幅度差函数进行基音周期计算。对所得声调曲线进行7维特征参数提取,利用隐马尔可夫模型建立汉语连续声调识别系统。系统正确识别率在训练集和测试集中分别为74.31%和71.37%,但声调三的识别率比较低。针对声调三识别率低的特点,本文对声调三音节的上下文语境进行实验研究。实验发现,当声调三音节为句尾或词尾时,其正确识别率为80%左右。考虑到音节的上下文语境和声调的特点,在声调识别系统中加入变调规则,搭建基于语境的声调识别系统。其识别率在训练集和测试集分别提高24.5%和21.1%,特别是声调三有显著提高。实验表明,基于上下文语境的声调识别系统的性能得到提升。本文最后对汉语连续数字串识别系统进行研究,实验发现存在容易误判的数字对,7(qi1)容易误判成4(si4),数字6(liu4)容易误判成9(jiu3)。考虑到声调具有辩意作用,在识别系统中加入声调识别模块,搭建基于声调信息的连续数字串识别系统。实验表明,改进后系统在训练集和测试集正确识别率为88.62%和83.36%,误判数字得到明显纠正,在连续数字串识别技术中加入声调信息能提高系统性能。

全文目录

摘要  5-6
Abstract  6-10
第1章绪论  10-14
  1.1 课题研究背景  10
  1.2 国内外课题研究进展  10-12
    1.2.1 语音识别研究进展  10-11
    1.2.2 语音识别研究难点  11-12
  1.3 课题研究的目的及意义  12
  1.4 主要研究内容  12-14
第2章语音识别基础知识及相关技术  14-23
  2.1 语音识别基本概念  14-16
    2.1.1 语音识别系统构架  14-15
    2.1.2 语音识别关键技术  15-16
  2.2 隐马尔可夫模型  16-18
  2.3 语音信号预处理  18-22
    2.3.1 采样及量化  18
    2.3.2 预加重  18-19
    2.3.3 分帧与加窗  19
    2.3.4 端点检测  19-22
  2.4 本章小结  22-23
第3章连续语音声调识别系统建立与实验  23-33
  3.1 汉语连续语音声调识别原理  23
  3.2 声调提取  23-30
    3.2.1 音节分割  24-26
    3.2.2 基音周期计算  26-27
    3.2.3 平滑处理  27-30
  3.3 特征参数提取  30-31
  3.4 HMM 声调模型建立及实验  31-32
    3.4.1 采用HMM 算法的声调识别系统  31
    3.4.2 训练和识别仿真  31-32
  3.5 本章小结  32-33
第4章基于语境的声调识别系统建立与实验  33-37
  4.1 语境中的声调三识别  33-35
  4.2 上下文语境的HMM 声调模型建立与实验  35-36
    4.2.1 上下文语境的HMM 声调识别系统  35
    4.2.2 训练和识别仿真  35-36
  4.3 本章小结  36-37
第5章基于声调信息的连续数字串识别系统  37-44
  5.1 汉语连续数字串识别  37-40
    5.1.1 语料库  38
    5.1.2 训练和识别仿真  38-40
  5.2 误判数字对识别  40-42
    5.2.1 数字4 和7  40-41
    5.2.2 数字6 和9  41-42
  5.3 系统不足与展望  42-43
  5.4 本章小结  43-44
结论  44-45
参考文献  45-48
攻读学位期间发表的学术论文  48-49
致谢  49

汉语连续语音声调及数字串识别系统的研究

内容摘要

全文目录

相似论文