学位论文 > 优秀研究生学位论文题录展示

汉语连续语音声调及数字串识别系统的研究

作 者: 严欢
导 师: 殷景华
学 校: 哈尔滨理工大学
专 业: 微电子学与固体电子学
关键词: 语音识别 声调识别 基音周期 隐马尔可夫模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 26次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音识别在人机交互、通信、互联网和工业化控制等方面有着重要应用前景。声调是汉语音节的重要组成部分,具有构词辨意作用。汉语语音识别技术目前的研究热点和难点是非特定人的连续语音。随着语音识别技术的发展,声调识别研究成为其突破的方向之一。本文首先对声调提取算法进行研究。采用基于多参数组合方法(短时能量、短时过零率、自相关函数值)进行语音信号清浊音判别,利用循环平均幅度差函数进行基音周期计算。对所得声调曲线进行7维特征参数提取,利用隐马尔可夫模型建立汉语连续声调识别系统。系统正确识别率在训练集和测试集中分别为74.31%和71.37%,但声调三的识别率比较低。针对声调三识别率低的特点,本文对声调三音节的上下文语境进行实验研究。实验发现,当声调三音节为句尾或词尾时,其正确识别率为80%左右。考虑到音节的上下文语境和声调的特点,在声调识别系统中加入变调规则,搭建基于语境的声调识别系统。其识别率在训练集和测试集分别提高24.5%和21.1%,特别是声调三有显著提高。实验表明,基于上下文语境的声调识别系统的性能得到提升。本文最后对汉语连续数字串识别系统进行研究,实验发现存在容易误判的数字对,7(qi1)容易误判成4(si4),数字6(liu4)容易误判成9(jiu3)。考虑到声调具有辩意作用,在识别系统中加入声调识别模块,搭建基于声调信息的连续数字串识别系统。实验表明,改进后系统在训练集和测试集正确识别率为88.62%和83.36%,误判数字得到明显纠正,在连续数字串识别技术中加入声调信息能提高系统性能。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-14
  1.1 课题研究背景  10
  1.2 国内外课题研究进展  10-12
    1.2.1 语音识别研究进展  10-11
    1.2.2 语音识别研究难点  11-12
  1.3 课题研究的目的及意义  12
  1.4 主要研究内容  12-14
第2章 语音识别基础知识及相关技术  14-23
  2.1 语音识别基本概念  14-16
    2.1.1 语音识别系统构架  14-15
    2.1.2 语音识别关键技术  15-16
  2.2 隐马尔可夫模型  16-18
  2.3 语音信号预处理  18-22
    2.3.1 采样及量化  18
    2.3.2 预加重  18-19
    2.3.3 分帧与加窗  19
    2.3.4 端点检测  19-22
  2.4 本章小结  22-23
第3章 连续语音声调识别系统建立与实验  23-33
  3.1 汉语连续语音声调识别原理  23
  3.2 声调提取  23-30
    3.2.1 音节分割  24-26
    3.2.2 基音周期计算  26-27
    3.2.3 平滑处理  27-30
  3.3 特征参数提取  30-31
  3.4 HMM 声调模型建立及实验  31-32
    3.4.1 采用HMM 算法的声调识别系统  31
    3.4.2 训练和识别仿真  31-32
  3.5 本章小结  32-33
第4章 基于语境的声调识别系统建立与实验  33-37
  4.1 语境中的声调三识别  33-35
  4.2 上下文语境的HMM 声调模型建立与实验  35-36
    4.2.1 上下文语境的HMM 声调识别系统  35
    4.2.2 训练和识别仿真  35-36
  4.3 本章小结  36-37
第5章 基于声调信息的连续数字串识别系统  37-44
  5.1 汉语连续数字串识别  37-40
    5.1.1 语料库  38
    5.1.2 训练和识别仿真  38-40
  5.2 误判数字对识别  40-42
    5.2.1 数字4 和7  40-41
    5.2.2 数字6 和9  41-42
  5.3 系统不足与展望  42-43
  5.4 本章小结  43-44
结论  44-45
参考文献  45-48
攻读学位期间发表的学术论文  48-49
致谢  49

相似论文

  1. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  2. 基于DSP的机器人语音命令识别系统研制,TN912.34
  3. 在智能手机环境下健康管理功能设计与研究,TN929.53
  4. 声道频响合成方法在军队姓名语音库的应用,TN912.3
  5. 移动音视频交互业务执行平台的研究,TN915.09
  6. 呼叫中心IVR系统的设计与实现,TN99
  7. 基于HMM的机器人语音识别系统的研究,TN912.34
  8. 基于MELP的低速率语音编码算法研究,TN912.3
  9. 汉语语音识别中语言模型的并行优化,TN912.34
  10. 基于音素的错误发音自动检测方法研究与应用,TN912.34
  11. 基于USB Audio设备类的音频密钥系统设计,TP309.7
  12. 汉语普通话中双音节词水平测试系统的设计与研究,TN912.34
  13. 基于DTW模型的孤立词语音识别算法实现研究,TN912.34
  14. 基于FPGA语音识别系统设计与实现,TN912.34
  15. 基于μ’nSP~(TM)处理器的嵌入式语音控制技术研究,TN912.3
  16. 汉语语言的物理特征提取及分析工具的研究与实现,TN912.34
  17. 人工耳蜗植入儿童的声调识别及发声研究,R764
  18. 基于改进MFCC的语音识别系统研究及设计,TN912.34
  19. 采用脉冲耦合神经网络的有噪特定人语音识别系统研究,TN912.34
  20. 低速率语音编码的研究,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com