学位论文 > 优秀研究生学位论文题录展示
旅游领域问句语音识别中规则语言模型自动构建研究
作 者: 邵佳
导 师: 郭剑毅
学 校: 昆明理工大学
专 业: 计算机应用技术
关键词: 语音识别 规则语言模型 自动构建 句型获取 词汇及短语获取
分类号: TN912.34
类 型: 硕士论文
年 份: 2013年
下 载: 15次
引 用: 0次
阅 读: 论文下载
内容摘要
语言模型作为语音识别系统的一个重要组成部分,能够为语音识别过程提供各种语言学知识。语言模型构建的好坏直接影响着系统的整体性能以及识别的准确率。相对于统计语言模型,规则语言模型在特定领域的语音识别系统中应用更为广泛。目前,规则语言模型一般都需要在领域专家的参与下进行人工构建。然而,汉语中的语法规则和词汇短语灵活多变,领域专家的知识很难覆盖该领域内所有的语言现象,最重要的是人工方式不但费时费力,而且错误率也相对较高。因此,本文围绕规则语言模型的基本构成要素——句型规则以及词汇短语的自动获取问题进行了一些尝试性地探索和研究,主要完成了以下几方面工作:1、规则语言模型中句型规则的自动获取。针对模型中句型规则灵活性差、覆盖率低等问题,采用了一种基于短语句法树的句型统计和自动获取方法。该方法首先对句法树库中的句法树进行两两最大相似子树的计算,并将其结果构成候选结构集。其次,统计候选结构集中各结构在句法树库中出现的频率,其中频率较高的结构组成候选句型集。最后,对候选句型集中的各句型进行权重计算,权重值大于指定阈值的候选句型即为满足我们要求的句型。实验证明,该方法在一定程度上提高了规则语言模型中句型规则的灵活性以及覆盖率。2、规则语言模型中词汇短语的自动获取。针对模型中词汇短语覆盖率和正确率偏低等问题,采用一种统计和规则相结合的方法来进行短语的识别和获取。该方法首先利用句子中相邻词语的词性互信息值对短语的边界进行预测,然后,利用总结的短语边界信息及内部构成规则对预测的结果进行边界调整并获取词汇短语。最后通过实验表明,该方法较好地提高了规则语言模型中短语的正确率以及覆盖率3、在上述工作的基础上,构建了一个旅游咨询领域的规则语言模型,并在语音识别原型系统中引入了该语言模型。最后,对系统进行了评价和分析。
|
全文目录
摘要 3-4 ABSTRACT 4-6 目录 6-9 第一章 绪论 9-13 1.1 研究背景及意义 9-10 1.2 语言模型的研究现状 10-11 1.3 本文研究内容 11-12 1.4 论文组织 12-13 第二章 语言模型及Nuance系统的相关介绍 13-21 2.1 语音识别中的两种语言模型 13-16 2.1.1 基于规则的语言模型 13-14 2.1.2 基于统计的语言模型 14-15 2.1.3 两种语言模型的比较 15-16 2.2 规则语言模型的基本构成要素 16-18 2.3 Nuance系统及其语言模型的相关介绍 18-20 2.4 本章小结 20-21 第三章 规则语言模型中句型规则的自动获取 21-33 3.1 引言 21-22 3.2 句型的定义及其特征 22 3.3 中文问句的句型分析 22-26 3.4 中文问句句型的自动获取 26-31 3.4.1 句法树库的构建 26-27 3.4.2 候选句型集的获取 27-29 3.4.3 句型集的获取 29-31 3.5 实验结果及分析 31-32 3.6 本章小结 32-33 第四章 规则语言模型中词汇短语的自动获取 33-43 4.1 引言 33-34 4.2 短语识别流程及所需知识资源 34 4.3 旅游领域命名实体库的构建 34-35 4.4 短语规则库的构建 35-39 4.4.1 汉语短语的定义及分类 35-36 4.4.2 汉语短语规则的归纳和总结 36-39 4.5 问句中短语的识别和获取 39-41 4.5.1 语气词和客气词过滤 39 4.5.2 分词和词性标记 39-40 4.5.3 基于互信息的短语边界预测 40-41 4.5.4 短语识别 41 4.6 实验结果和分析 41-42 4.7 本章小结 42-43 第五章 旅游领域问句语音识别原型系统的设计与实现 43-51 5.1 引言 43-44 5.2 基于Nuance平台的旅游领域问句语音识别原型系统的设计和实现 44-47 5.2.1 系统的整体框架 44 5.2.2 问句语料收集 44-45 5.2.3 问句句型规则的获取 45 5.2.4 词汇短语的获取 45 5.2.5 Nuance平台中规则语言模型的生成 45-46 5.2.6 Nuance平台上的系统开发以及语音识别过程 46-47 5.3 语音识别原型系统展示 47-48 5.4 系统分析及评价 48-49 5.4.1 系统测试数据及测试结果 48-49 5.4.2 系统分析和评价 49 5.5 本章小结 49-51 第六章 结束语 51-53 6.1 总结 51-52 6.2 下一步工作 52-53 致谢 53-55 参考文献 55-59 附录A 攻读硕士期间的软件著作权 59-60 附录B 攻读硕士期间参与的项目 60
|
相似论文
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 基于ARM9的孤立词语音识别系统设计,TN912.34
- 语音识别技术研究与实现,TN912.34
- 车载汉语语音控制命令识别算法的研究,U463.6
- 基于分段概率模型语音识别算法的SOPC实现,TN47
- 车载多媒体语音识别系统设计,TN912.34
- 家庭监护机器人关键技术的研究与实现,TP242
- 基于SPCE061A单片机的数控机床控制系统的设计与实现,TG659
- 移动音视频交互业务执行平台的研究,TN915.09
- 基于HMM的机器人语音识别系统的研究,TN912.34
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 基于嵌入式语音识别系统的研究,TN912.34
- 仿真机器人控制系统,TP242
- 基于HMM和PNN的混合语音识别模型研究,TN912.34
- 移动机器人语音识别控制仿真系统的设计与实现,TN912.34
- 基于动态贝叶斯网络的连续语音识别研究,TN912.34
- 基于STRAIGHT谱的语音识别算法研究,TN912.34
- 面向机器人对话的语音识别关键技术的研究,TN912.34
- 基于特定人的汉语语音识别的研究与实现,TN912.34
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|