学位论文 > 优秀研究生学位论文题录展示

限定领域内问答系统的设计与实现

作 者: 崔艳敏
导 师: 高光来
学 校: 内蒙古大学
专 业: 计算机应用技术
关键词: 问答系统 问题理解 信息检索 答案抽取
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 65次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着Internet的快速发展,网上的信息越来越多,如何在海量的信息中快速准确的找到所需要的信息成为目前的一个研究热点。搜索引擎的出现,在一定程度上解决了用户获取信息的需求,但通常会对用户的提问返回成百上千个网页,用户还需手工查找才能获得最终的答案。问答系统是新一代智能搜索引擎,它允许用户以自然语言的形式进行提问,并向用户返回准确的答案。所以,与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案,是未来发展的方向。本文就问答系统中的三个核心问题:问题理解信息检索答案抽取进行了探讨,根据计算机领域的特点,设计并实现了一个基于网络的中文问答系统。问题理解是中文问答系统首先进行的工作,此过程的分析结果对后面的处理具有重要的影响。本文在此阶段做了如下工作:在通用分词词典的基础上,加入计算机专业词汇,排除了词类歧义;对用户以自然语言的形式提问的问题,运用基于疑问词和疑问焦点相结合的方法进行问题分类,实验结果表明,该方法是行之有效的。信息检索是问答系统中承上启下的重要组成部分,其性能优劣直接影响到答案抽取模块的准确性。本文提出了一种双策略检索方法,即本地知识库检索和网络检索。如果从本地知识库中检索到满足条件的问题答案,则直接将答案返回给用户;如果没有找到,就进行网络检索。进行网络检索时,将根据问题理解所得到的问题类型,采取不同的检索策略。在答案抽取阶段,答案的选择最终决定了用户的体验。本文就该部分进行了初步探讨,并尝试着用一种变通的方法实现了对某些特定问题类型答案的提取。最后,介绍了系统实现和试验结果及其评价。

全文目录


摘要  4-6
ABSTRACT  6-8
目录  8-10
图表目录  10-11
第一章 绪论  11-19
  1.1 本文的研究背景和意义  11-12
  1.2 问答系统研究概述  12-17
    1.2.1 问答系统的国内外研究现状  12-13
    1.2.2 问答系统的分类  13-15
    1.2.3 问答系统的核心问题  15-16
    1.2.4 问答系统的评测方法  16-17
  1.3 研究内容与组织结构  17-19
    1.3.1 研究内容  17-18
    1.3.2 组织结构  18-19
第二章 问题理解  19-30
  2.1 引言  19
  2.2 问题理解的流程  19-28
    2.2.1 词法分析  20-22
    2.2.2 问题分类  22-25
    2.2.3 关键词提取  25-26
    2.2.4 关键词扩展  26-27
    2.2.5 生成检索表达式  27-28
  2.3 本章小结  28-30
第三章 信息检索  30-41
  3.1 信息检索的理论基础  30-34
    3.1.1 信息检索系统的结构  30-31
    3.1.2 信息检索的三个数学模型  31-34
  3.2 问答系统中的信息检索  34-35
  3.3 本系统的信息检索方法  35-40
    3.3.1 检索流程  35-36
    3.3.2 信息源的选择  36-38
    3.3.3 复杂类问题的二次检索  38-40
  3.4 本章小结  40-41
第四章 系统实现与评价  41-50
  4.1 设计思想  41-42
  4.2 系统总体框架  42
  4.3 系统实现与评测  42-50
    4.3.1 简单类问题答案抽取的实现  43-47
    4.3.2 各模块的评测标准  47
    4.3.3 实验结果与评价  47-50
第五章 总结  50-52
参考文献  52-55
致谢  55

相似论文

  1. 基于词义及语义分析的问答技术研究,TP391.1
  2. 生物医学领域检索系统查询扩展技术研究,TP391.3
  3. 针对教育视频的虚拟学习社区设计与实现,G434
  4. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  5. 英汉跨语言问答系统中的文档语义检索,TP391.1
  6. 领域知识对领域问答系统答案抽取影响研究,TP391.3
  7. 旅游本体知识库的构建及推理应用研究,TP391.1
  8. 金融领域的博客信息采集与排序算法研究,TP393.092
  9. 最大熵模型的语义句法分析在问答系统中的应用研究,TP391.1
  10. 基于意义理解的问答系统设计与实现,TP311.52
  11. 基于本体的文本信息检索研究,TP391.1
  12. 基于Hadoop的机械故障诊断资源分布式信息检索系统的设计与实现,TP391.3
  13. 基于链接结构的站点主题层次抽取方法,TP393.092
  14. 中文问答系统中多策略答案抽取技术的研究,TP391.3
  15. 中—英文跨语言问答式信息检索技术研究,TP391.3
  16. 基于概念扩展的中文问答系统模型研究,TP391.1
  17. 关系数据库关键词检索系统研究,TP311.13
  18. 主题语义检索技术在信息集成中的研究及应用,TP391.3
  19. 基于复杂在线网络的社会化搜索,TP391.3
  20. 基于动态本体知识库的问答系统的研究与实现,TP391.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com