学位论文 > 优秀研究生学位论文题录展示
基于语音界面的中文问答系统设计与实现
作 者: 叶得学
导 师: 林和;杨易平
学 校: 兰州大学
专 业: 软件工程
关键词: 问答系统 问题分析 信息检索 答案抽取 语音界面
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 44次
引 用: 0次
阅 读: 论文下载
内容摘要
用户在新一代的智能搜索引擎——问答系统环境下,可以用自然语言提出问题,并能获取准确的搜索答案。相对于传统的搜索引擎,问答系统可以更便捷地满足不同用户的查询需求,并能更加准确地为用户检索到所需答案。论文结合自然语言处理技术,研究了中文问答系统中的两个关键技术:问题理解与信息检索。采用Visual C++开发环境实现了一个中文问答系统,除此之外,还对中文问答系统进行语音界面扩展,实现了非受限领域的、可完全通过语音交互的自动问答系统。本文的研究成果和相关的具体内容如下:首先,本文对中文问答系统中问题理解过程进行分析研究。针对问题理解过程,提出了基于疑问焦点的问题分类方法;建立问句句型库,进行问句分析,从而提高了系统对不同表达方式提问的处理能力;采用机器学习方法——最大熵模型作为分类器,进行问句的语义角色标注,并转化为语义框架结构。其次,本文对影响中文问答系统性能的另一核心问题信息检索进行了研究。提出了一种FW检索方法,包括FAQ库检索和Web检索。利用网络中的共享知识平台,构建了规模较大的常见问题知识库,以实现本地知识库检索;本地知识库搜索失败,则利用Google搜索得到的网页片断作为抽取答案的资源,进行Web检索。最后,本文还尝试将语音界面引入到非受限领域的自动问答系统。由于语音识别准确率直接影响着问答系统运行的整体性能。故系统设计时没有自行开发语音识别系统,而是采用了成熟的IBM ViaVoice语音识别系统,实现了一个语音界面扩展的中文问答系统。
|
全文目录
摘要 3-4 Abstract 4-8 第1章 绪论 8-12 1.1 论文研究背景及意义 8 1.2 问答系统国内外研究现状 8-9 1.2.1 问答系统国外研究概况 8-9 1.2.2 问答系统国内研究概况 9 1.3 论文研究的主要内容 9-10 1.4 论文创新点 10 1.5 论文结构 10-12 第2章 研究的总体思路与关键技术 12-24 2.1 研究的总体思路 12 2.2 拟解决的关键问题 12-13 2.3 相关技术 13-22 2.3.1 问题分析相关技术的选择 13-19 2.3.2 信息检索技术的选择 19-21 2.3.3 句子相似度算法的选择 21-22 2.4 本章小结 22-24 第3章 基于语音界面的中文问答系统需求分析 24-28 3.1 语音界面问答系统的研究价值和挑战 24-25 3.2 系统目标 25 3.3 系统需求分析 25-26 3.3.1 功能需求 25 3.3.2 性能需求 25-26 3.4 本章小结 26-28 第4章 基于语音界面的中文问答系统设计 28-40 4.1 系统设计思想 28-29 4.2 系统框架 29 4.3 系统模块设计 29-38 4.3.1 语音识别模块设计 29-30 4.3.2 FAQ模块设计 30-31 4.3.3 问题分析模块设计 31-36 4.3.4 信息检索模块设计 36-38 4.3.5 答案抽取模块设计 38 4.4 本章小结 38-40 第5章 基于语音识别的中文问答系统实现 40-50 5.1 语音识别系统 40-41 5.2 问答系统实现 41-48 5.2.1 FAQ模块的实现 44-45 5.2.2 问题分析模块的实现 45-46 5.2.3 信息检索模块的实现 46 5.2.4 答案抽取模块的实现 46-48 5.3 本章小结 48-50 第6章 基于语音界面的中文问答系统测试 50-56 6.1 系统测试问句举例 50-52 6.2 测试结果与分析 52-55 6.3 系统的评价 55 6.4 本章小结 55-56 结论 56-58 参考文献 58-60 附录 60-63 攻读硕士学位期间的研究成果 63-64 致谢 64-65 插图索引 65-66 附表索引 66
|
相似论文
- 基于词义及语义分析的问答技术研究,TP391.1
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 面向海量邮件的检索系统研究与实现,TP393.098
- 国有大型企业所属职业学校办学问题研究,G719.2
- 太原市电视台法制栏目发展策略研究,G222
- 中学生自我意识问题分析,G632.4
- 中学语文教师课堂教学语言探微,G633.3
- 针对教育视频的虚拟学习社区设计与实现,G434
- 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
- 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
- 黑龙江垦区红兴隆分局植物保护创新体系建设,S4
- 英汉跨语言问答系统中的文档语义检索,TP391.1
- 基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
- 论我国城市房屋拆迁补偿制度的完善,D922.181
- 基于知网的受限域问答系统原型的设计与实现,TP391.1
- 领域知识对领域问答系统答案抽取影响研究,TP391.3
- 基于增量改进贝叶斯领域问句分类研究,TP391.3
- 问答对自动获取的研究,TP391.1
- 基于多Agent及元搜索技术的中文问答系统的研究和应用,TP391.1
- E-Learning系统中基于课程本体的用户兴趣模型挖掘,TP311.13
- 农村中小学校义务教育经费预算管理研究,G637
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|