学位论文 > 优秀研究生学位论文题录展示
汉语连续语音声调及数字串识别系统的研究
作 者: 严欢
导 师: 殷景华
学 校: 哈尔滨理工大学
专 业: 微电子学与固体电子学
关键词: 语音识别 声调识别 基音周期 隐马尔可夫模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 26次
引 用: 0次
阅 读: 论文下载
内容摘要
语音识别在人机交互、通信、互联网和工业化控制等方面有着重要应用前景。声调是汉语音节的重要组成部分,具有构词辨意作用。汉语语音识别技术目前的研究热点和难点是非特定人的连续语音。随着语音识别技术的发展,声调识别研究成为其突破的方向之一。本文首先对声调提取算法进行研究。采用基于多参数组合方法(短时能量、短时过零率、自相关函数值)进行语音信号清浊音判别,利用循环平均幅度差函数进行基音周期计算。对所得声调曲线进行7维特征参数提取,利用隐马尔可夫模型建立汉语连续声调识别系统。系统正确识别率在训练集和测试集中分别为74.31%和71.37%,但声调三的识别率比较低。针对声调三识别率低的特点,本文对声调三音节的上下文语境进行实验研究。实验发现,当声调三音节为句尾或词尾时,其正确识别率为80%左右。考虑到音节的上下文语境和声调的特点,在声调识别系统中加入变调规则,搭建基于语境的声调识别系统。其识别率在训练集和测试集分别提高24.5%和21.1%,特别是声调三有显著提高。实验表明,基于上下文语境的声调识别系统的性能得到提升。本文最后对汉语连续数字串识别系统进行研究,实验发现存在容易误判的数字对,7(qi1)容易误判成4(si4),数字6(liu4)容易误判成9(jiu3)。考虑到声调具有辩意作用,在识别系统中加入声调识别模块,搭建基于声调信息的连续数字串识别系统。实验表明,改进后系统在训练集和测试集正确识别率为88.62%和83.36%,误判数字得到明显纠正,在连续数字串识别技术中加入声调信息能提高系统性能。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-14 1.1 课题研究背景 10 1.2 国内外课题研究进展 10-12 1.2.1 语音识别研究进展 10-11 1.2.2 语音识别研究难点 11-12 1.3 课题研究的目的及意义 12 1.4 主要研究内容 12-14 第2章 语音识别基础知识及相关技术 14-23 2.1 语音识别基本概念 14-16 2.1.1 语音识别系统构架 14-15 2.1.2 语音识别关键技术 15-16 2.2 隐马尔可夫模型 16-18 2.3 语音信号预处理 18-22 2.3.1 采样及量化 18 2.3.2 预加重 18-19 2.3.3 分帧与加窗 19 2.3.4 端点检测 19-22 2.4 本章小结 22-23 第3章 连续语音声调识别系统建立与实验 23-33 3.1 汉语连续语音声调识别原理 23 3.2 声调提取 23-30 3.2.1 音节分割 24-26 3.2.2 基音周期计算 26-27 3.2.3 平滑处理 27-30 3.3 特征参数提取 30-31 3.4 HMM 声调模型建立及实验 31-32 3.4.1 采用HMM 算法的声调识别系统 31 3.4.2 训练和识别仿真 31-32 3.5 本章小结 32-33 第4章 基于语境的声调识别系统建立与实验 33-37 4.1 语境中的声调三识别 33-35 4.2 上下文语境的HMM 声调模型建立与实验 35-36 4.2.1 上下文语境的HMM 声调识别系统 35 4.2.2 训练和识别仿真 35-36 4.3 本章小结 36-37 第5章 基于声调信息的连续数字串识别系统 37-44 5.1 汉语连续数字串识别 37-40 5.1.1 语料库 38 5.1.2 训练和识别仿真 38-40 5.2 误判数字对识别 40-42 5.2.1 数字4 和7 40-41 5.2.2 数字6 和9 41-42 5.3 系统不足与展望 42-43 5.4 本章小结 43-44 结论 44-45 参考文献 45-48 攻读学位期间发表的学术论文 48-49 致谢 49
|
相似论文
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 声道频响合成方法在军队姓名语音库的应用,TN912.3
- 移动音视频交互业务执行平台的研究,TN915.09
- 呼叫中心IVR系统的设计与实现,TN99
- 基于HMM的机器人语音识别系统的研究,TN912.34
- 基于MELP的低速率语音编码算法研究,TN912.3
- 汉语语音识别中语言模型的并行优化,TN912.34
- 基于音素的错误发音自动检测方法研究与应用,TN912.34
- 基于USB Audio设备类的音频密钥系统设计,TP309.7
- 汉语普通话中双音节词水平测试系统的设计与研究,TN912.34
- 基于DTW模型的孤立词语音识别算法实现研究,TN912.34
- 基于FPGA语音识别系统设计与实现,TN912.34
- 基于μ’nSP~(TM)处理器的嵌入式语音控制技术研究,TN912.3
- 汉语语言的物理特征提取及分析工具的研究与实现,TN912.34
- 人工耳蜗植入儿童的声调识别及发声研究,R764
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 采用脉冲耦合神经网络的有噪特定人语音识别系统研究,TN912.34
- 低速率语音编码的研究,TN912.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|