学位论文 > 优秀研究生学位论文题录展示

基于逻辑表示与推理的阅读理解答案抽取

作 者: 张志辉
导 师: 张宇
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 阅读理解 答案句抽取 文本逻辑表示 自动逻辑推理
分类号: TP391.1
类 型: 硕士论文
年 份: 2008年
下 载: 55次
引 用: 0次
阅 读: 论文下载
 

内容摘要


自动问答系统是信息检索领域的一个重要研究方向,阅读理解系统是其一个重要研究分支。阅读理解系统通过对一篇自然语言文本的分析理解,针对用户根据该文本所提的问题,自动抽取或者生成答案。知识表示与推理作为一种自然语言理解方法,具有将上下文知识形式化并易于自动推理的优点。本文将知识表示与推理应用于阅读理解系统。将逻辑推理应用与阅读理解需要将阅读理解问题转换为合适的逻辑推理问题,用逻辑推理得到的论证对阅读理解的问题进行答案抽取。在文本的知识表示方法上,本文采用文本谓词表示方法。文本谓词表示是一种一阶谓词逻辑表示方法,不同的单词对应不同的逻辑谓词,谓词参数的位置信息表示句法语义信息。为实现文本谓词表示的自动生成,本文在句法分析的结果上建立了逻辑表示转换系统。并在定理证明机Prover9的基础上实现了文本逻辑表示的自动推理系统。首先,本文将阅读理解篇章与问题送入逻辑表示转换系统生成对应的文本逻辑表示,对问题逻辑表示深入处理以保持阅读理解问题的意义;然后将逻辑表示与相关推理知识交给逻辑推理系统,得出推理论证。在逻辑推理的过程中,知识库的作用至关重要。本文采用XWN作为推理知识库,并提出了一些推理规则作为知识库的补充。实验表明,这些补充推理规则提高了逻辑推理的准确率。最后,本文按词袋方法从推理论证中抽取答案句,并用词袋方法为无法得到逻辑推理论证的问题抽取答案。最终在Remedia语料上获得了39.0%的HumSent准确率。本文还尝试用词袋方法返回多个答案,用逻辑推理方法对多个答案进行重排序,这种方法在Remedia语料上获得了40.0%的HumSent准确率。

全文目录


摘要  4-5
Abstract  5-10
第1章 绪论  10-20
  1.1 课题背景及意义  10-11
  1.2 阅读理解  11-13
  1.3 文本逻辑表示与逻辑推理  13-15
    1.3.1 文本逻辑表示  14
    1.3.2 逻辑推理  14
    1.3.3 XWN推理知识库  14-15
  1.4 国内外研究现状  15-17
    1.4.1 阅读理解系统研究现状  15-16
    1.4.2 文本逻辑表示研究现状  16-17
  1.5 本文主要研究内容  17-20
第2章 逻辑表示与逻辑推理  20-28
  2.1 逻辑表示  20-23
    2.1.1 一阶谓词逻辑  20-23
  2.2 逻辑推理  23-26
    2.2.1 谓词逻辑的演绎推理方法  23-24
    2.2.2 消解法  24-26
  2.3 逻辑推理工具  26-27
    2.3.1 定理证明机Prove19  26-27
  2.4 本章小结  27-28
第3章 文本逻辑表示与转换  28-42
  3.1 文本谓词表示  28-31
  3.2 逻辑表示转换  31-41
    3.2.1 逻辑转换系统结构  31-33
    3.2.2 前序处理  33-34
    3.2.3 逻辑转换规则  34-36
    3.2.4 自底向上生成逻辑表示  36-40
    3.2.5 逻辑转换启发式规则  40-41
  3.3 本章小结  41-42
第4章 逻辑推理应用于阅读理解  42-56
  4.1 逻辑表示后处理  43-44
    4.1.1 篇章逻辑表示  43
    4.1.2 问题逻辑表示  43-44
  4.2 逻辑推理过程  44-47
    4.2.1 推理论证  44-45
    4.2.2 推理的效率  45-47
  4.3 答案句抽取  47-48
  4.4 逻辑推理知识库  48-50
    4.4.1 XWN相关知识  48
    4.4.2 WordNet上位关系知识  48-49
    4.4.3 命名实体知识  49-50
  4.5 对问题处理过程  50-52
    4.5.1 问题约束加强  50-51
    4.5.2 问题约束放松  51-52
    4.5.3 问题处理的综合  52
  4.6 相关实验和分析  52-55
    4.6.1 实验设置  53
    4.6.2 知识库的相关实验  53-54
    4.6.3 问题处理的相关实验  54-55
  4.7 本章小结  55-56
第5章 答案抽取实验及结果分析  56-63
  5.1 实验设置  56-57
    5.1.1 语料  56
    5.1.2 评价方法  56-57
  5.2 实验方法  57-59
    5.2.1 基准词袋方法  57
    5.2.2 VSM方法  57-58
    5.2.3 基于逻辑推理论证的方法  58
    5.2.4 多词袋结果重排序  58
    5.2.5 三个答案句的评价  58-59
  5.3 实验结果及分析  59-62
    5.3.1 实验结果  59-60
    5.3.2 实验结果分析  60-62
  5.4 本章小结  62-63
结论  63-64
参考文献  64-69
致谢  69

相似论文

  1. 英语专业学生的模糊容忍度和阅读理解成绩的相关研究,H319
  2. 中专生阅读策略训练的实证研究,G633.41
  3. 中学生汉英句法意识在汉英双语语篇阅读中的作用,G633.41
  4. 英语语音意识,句法意识与工作记忆对英语阅读理解之预测力的动态变化,G633.41
  5. 基于书面语的对外汉语阅读理解教学研究,H195
  6. 英语专业四级考试阅读理解内容效度研究,H319
  7. 语用关联理论与大学英语阅读理解,H319
  8. 概念导向型阅读教学对大学生英语阅读能力的影响,H319
  9. 英语专业四级考试与大学英语六级考试阅读理解测试部分对比研究,H319
  10. 广东省高考英语阅读理解内容效度分析(2004-2010),G634.41
  11. 关联理论在初中英语阅读教学中应用的实证研究,G633.41
  12. 图式理论框架下的阅读心理分析及小说体阅读能力培养,H319
  13. 图式理论在初三英语学困生阅读教学中的探索与实践,G633.41
  14. 初探英语专业学生文化休克现象与阅读理解能力的关系,G633.41
  15. 文化背景知识对高中生英语阅读的影响调查,G633.41
  16. 显性概念隐喻教学对大学生英语阅读能力的影响,H319
  17. 模糊容忍度和阅读理解的相关性研究,H319
  18. 如何培养孤儿学生的阅读能力,H193
  19. 书面语篇话语标记语的元功能及对大学英语阅读理解的指导,H319
  20. 基于4C/ID模型的大学公共英语阅读理解能力培养研究,H319

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com