学位论文 > 优秀研究生学位论文题录展示
汉语人机对话系统中口语处理的研究
作 者: 王彬
导 师: 江铭虎
学 校: 清华大学
专 业: 语言学与应用语言学
关键词: 人机对话系统 口语分析 自然语言处理
分类号: H085
类 型: 硕士论文
年 份: 2004年
下 载: 229次
引 用: 2次
阅 读: 论文下载
内容摘要
在一个信息技术高速发展的时代,如何获取信息和传递信息是值得关注的两大问题。人机对话系统的研究正是聚焦在这两大问题上,力图使信息的获取和传递变得更加轻松自然,使人们可以更加方便自如地与计算机进行信息交互。本文的目标是在对人机对话系统所需技术进行深入研究的基础上,实现一个面向受限领域的汉语口语人机对话系统,研究重点是系统框架的构建、语言处理技术的应用以及对话管理方法的选择。口语分析与传统的自然语言理解技术有着密切关系,然而又有其自身的特点和难点。本文旨在探讨口语分析中可能遇到的问题及其解决途径,介绍了目前国内外较为成功的一些口语系统,对其中采取的有代表性的口语分析方法做了较为全面和深入的分析。传统的自然语言理解方法不能适应自发的口语中大量重复、省略、成分无序、语气词随意等现象,因此本文以提高规则的描述能力作为指导思想,提出了一种改进的CFG文法,同时改造了传统的Tomita算法,并在此基础上设计出基于概念识别的口语分析器。系统的句法和语义分析都是围绕该规则文法进行的。同时,作者也初步探讨了对话管理中的话语分析方法,提出主题树的知识表示方法,用树形结构描述对话过程中涉及的各项信息,将领域概念和对话历史的表示结合起来,并在此结构基础上进行知识管理,组织应答数据库,提供应答模板。本文在结合分析了汉语的句法、语义、语用等多种知识源后,实现了一个适用于美容产品信息咨询领域的口语对话系统。作者收集了领域内的口语语料,从中提取出基于概念的领域词汇组成词表,并分析了口语会话中的各种语言现象,从而编写了相应的语法规则。实验证明对话系统的口语分析器具有一定的鲁棒性,在相关领域内取得了较好的效果。在最后一章中作者对本文所做的各项工作给以总结,并对未来如何进一步改进口语分析器以及对话系统框架的可定制性做出展望。
|
全文目录
中文摘要 3-4 Abstract 4-6 目录 6-9 第一章 引 言 9-17 1.1 人机对话系统概述 9-15 1.1.1 人机对话系统的定义 10-11 1.1.2 人机对话系统的意义 11-12 1.1.3 人机对话系统的研究内容 12-15 1.2 作者的研究工作及本文的组织 15-17 1.2.1 研究目标及内容 15-16 1.2.2 论文的组织结构 16-17 第二章 对话系统的发展状况与研究方法 17-28 2.1 对话系统的总体研究情况 17-21 2.1.1 国外研究情况 17-20 2.1.2 我国研究情况 20-21 2.2 研究方法分类 21-28 2.2.1 语音处理技术 21 2.2.2 语言理解技术 21-25 2.2.3 对话管理策略 25 2.2.4 系统应用技术 25-28 第三章 对话系统中的句法分析 28-46 3.1 基于规则的句法分析理论 28-33 3.1.1 文法规则 29-30 3.1.2 Tomita算法 30-33 3.2 鲁棒的口语分析器 33-42 3.2.1 问题的提出 33-35 3.2.2 限定领域的文法规则设计 35-37 3.2.3 自底向上与并行处理的策略 37 3.2.4 改进的Tomita算法 37-42 3.3 歧义问题讨论 42-44 3.4 句法分析的作用 44 3.5 小结 44-46 第四章 对话系统中的语义分析 46-58 4.1 语义分析的层次 46-47 4.2 语义文法 47-50 4.2.1 语义结构 47-48 4.2.2 语义文法中的符号 48-50 4.2.3 语义文法规则 50 4.3 语义分析 50-57 4.3.1 基于格语法的语义表示 50-53 4.3.2 基于格框架的语义分析 53-56 4.3.3 语义解释函数 56-57 4.4 小结 57-58 第五章 对话系统中的话语分析 58-71 5.1 话语分析与对话管理的关系 58-60 5.1.1 对话管理的概念 58-60 5.1.2 话语分析在对话系统中的作用 60 5.2 话语分析的理论基础 60-62 5.3 对话管理的方法 62-65 5.4 话语分析在对话管理中的应用 65-70 5.4.1 主题树的话语表示方法 65-67 5.4.2 限定领域下的主题树设计 67-68 5.4.3 期待焦点与应答生成 68-70 5.5 小结 70-71 第六章 系统的实现及评测 71-82 6.1 系统设计原则及概况介绍 71-72 6.2 系统总体流程图 72-73 6.3 各模块的实现 73-78 6.3.1 文本预处理 73-74 6.3.2 句法语法分析 74-75 6.3.3 对话管理 75-78 6.3.4 应答生成 78 6.4 对话实例 78-79 6.5 系统性能评价 79-82 6.5.1 性能评价方法 79 6.5.2 分析结果的表示 79-82 第七章 结论与展望 82-84 7.1 总结 82 7.2 展望 82-84 参考文献 84-90 致谢及声明 90-91 附录 91-98 个人简历 98
|
相似论文
- 面向交互式动画创作的儿童故事情节抽取,TP391.1
- 基于统计的多文档关键短语和文摘抽取研究,TP391.1
- 基于主题模型的中英文多文档自动文摘,TP391.1
- 融合统计与规则技术的蒙古语词法分析研究,TP391.1
- 新闻语料中名词短语识别的研究,TP391.43
- 比较句与比较关系识别研究及其应用,TP391.1
- 基于规则与统计的语气词用法自动识别研究,TP391.1
- 词义消歧语料库自动获取方法研究,TP391.1
- 汉语中基于短语结构的语义提取,TP391.1
- 事实类问题回答研究,TP391.3
- 列表类自动问题问答系统的设计与实现,TP311.52
- 基于倾向性分析的文本信息过滤技术研究,TP391.1
- 基于二元组合文法的概率消歧模型设计与实现,TP391.1
- 机械产品设计领域动词属性结构的研究与应用,TH122
- 中文产品评论的意见挖掘研究,TP391.1
- 限定领域自动问答技术研究,TP391.1
- 中文自动分词系统的研究与实现,TP391.1
- 中文新词识别研究,TP391.1
- 基于语义分析的查询扩展及其关键技术研究,TP391.1
- 基于语义范畴扩展的词义消歧的研究,TP391.1
- 作者写作特征提取引擎,TP391.3
中图分类: > 语言、文字 > 语言学 > 应用语言学 > 机器翻译
© 2012 www.xueweilunwen.com
|