学位论文 > 优秀研究生学位论文题录展示

句法及语义联合标注方法的研究与实现

作 者: 石柳
导 师: 陈恩红
学 校: 中国科学技术大学
专 业: 计算机应用技术
关键词: 句法依存解析 语义角色标注 联合标注 概率评估模型 迭代模型
分类号: TP391.1
类 型: 硕士论文
年 份: 2009年
下 载: 82次
引 用: 0次
阅 读: 论文下载
 

内容摘要


计算机的发展激起了人们对人工智能的渴望,互联网的飞速膨胀改变人们对信息的理解。人们希望计算机能和人类用语言交流,能读懂互联网上的信息,能帮助人们从海量的信息中准确地找到需要的信息。但是如何来做到这些呢?首先得让计算机“学会”人类的语言。这也就是人工智能的一个重要分支——自然语言理解所要研究的内容。然而,这是一项非常艰巨的任务。在巨大的困难和多次的失败面前,学者们开始将注意力集中在简单,但是实用、较小的任务上。语义角色标注便是其中很有代表性的一个方向。它是浅层语义分析的一种,对句子进行浅层次的分析和标注。其结果可以用于更深层次的语义分析,从而逐步实现自然语言理解的目标。语义角色标注在句法和语义之间架起了一座桥梁,是进行自然语言理解的基础性工作,具有很重要的意义。但是这座桥还需要句法研究的支持。其中一个很重要的内容就是句法依赖解析的研究。句法依赖解析和语义角色标注在经过多年的研究之后取得了不错的效果,但是仍有较大的提升空间。本文就是从另外一个角度,研究联合标注方法,使得不仅能够使用句法信息来帮助语义角色标注,也能使用语义信息来促进句法解析和标注,达到互相促进相辅相成的效果。本文主要工作和特色如下:1)设计并实现了一种基于概率评估模型的联合标注新方法。在生成多组较优的候选结果基础上,再从全局的角度对这些候选结果进行评估,选出一个全局较优的标注结果。从而克服了先句法后语义的传统流水线式标注方法中贪心策略的一些不足。2)修改传统的基于要素的语义角色标注方法中使用的特征,使之适用于基于依存表示的语义角色标注。3)设计并实现了一种基于迭代模型的联合标注方法。通过迭代,可以将语义标注的信息反馈给句法解析模块,甚至反馈给语义角色标注模块,从而修正标注结果,提升系统的整体标注效果。4)在基于迭代模型的联合标注系统中,针对句法和语义的相关标注,分别设计了用于迭代标注的特征来扩充原有的特征,以便利用迭代模型反馈回来的上一次迭代标注信息。

全文目录


摘要  4-5
ABSTRACT  5-9
第1章 绪论  9-16
  1.1 研究背景和意义  9-11
    1.1.1 句法  9-10
    1.1.2 语义  10-11
  1.2 研究内容  11
  1.3 国内外研究现状  11-14
    1.3.1 句法依存解析评测  12
    1.3.2 语义角色标注评测  12-13
    1.3.3 联合标注评测  13-14
  1.4 本文的主要工作  14
  1.5 本文组织结构  14-16
第2章 传统的句法语义标注  16-30
  2.1 概述  16
  2.2 语料资源  16-18
  2.3 机器学习方法  18-22
    2.3.1 生成模型  20
    2.3.2 判别模型  20-22
  2.4 基于LR 分析的句法解析  22-24
    2.4.1 任务描述  22
    2.4.2 句法解析过程  22-24
    2.4.3 评测方法  24
  2.5 基于最大熵模型的语义角色标注  24-29
    2.5.1 标注单元  24-25
    2.5.2 标注过程  25-27
    2.5.3 设计特征  27-28
    2.5.4 评测方法  28-29
  2.6 本章小结  29-30
第3章 基于概率评估模型的联合标注系统  30-39
  3.1 概述  30
  3.2 任务描述  30-31
  3.3 系统结构  31-33
  3.4 模块介绍  33-37
    3.4.1 句法依存解析和标注  33-34
    3.4.2 谓词识别  34
    3.4.3 谓词标注  34-36
    3.4.4 语义角色标注  36-37
  3.5 实验及讨论  37-38
    3.5.1 语料资源  37
    3.5.2 评测方法  37
    3.5.3 实验结果与分析  37-38
  3.6 本章小结  38-39
第4章 基于迭代模型的联合标注系统  39-58
  4.1 概述  39
  4.2 任务描述  39-41
    4.2.1 语种  40
    4.2.2 数据格式  40-41
  4.3 迭代模型  41-45
    4.3.1 系统结构  42-43
    4.3.2 迭代模型构建  43-45
  4.4 模块介绍  45-50
    4.4.1 句法结构解析  45
    4.4.2 句法依存关系标注  45-47
    4.4.3 谓词标注  47-49
    4.4.4 语义角色标注  49-50
  4.5 实验及讨论  50-57
    4.5.1 语料资源  50-51
    4.5.2 模块测试  51-55
    4.5.3 系统测试  55-57
  4.6 本章小结  57-58
第5章 工作总结及展望  58-60
  5.1 本文工作总结  58-59
  5.2 下一步的研究工作  59-60
参考文献  60-63
致谢  63-64
在读期间发表的学术论文与取得的研究成果  64

相似论文

  1. 基于马尔可夫逻辑网络的语义角色标注,TP391.1
  2. 语义角色标注的集成策略的研究,TP391.1
  3. 基于Web的比较观点挖掘方法研究,TP391.1
  4. 基于依存关系的中文语义角色标注研究,TP391.1
  5. 基于依存句法分析的语义角色标注,TP391.1
  6. 基于条件随机场模型的汉语框架语义角色自动标注研究,TP391.1
  7. 面向三维场景生成的中文语义角色标注方法研究,TP391.1
  8. 基于汉语框架网的问句语义角色标注研究,TP391.1
  9. 基于支持向量机的汉语框架语义角色自动标注,TP391.1
  10. 基于最大熵模型的汉语框架语义角色自动标注,TP391.1
  11. 基于条件场的语义角色标注,TP391.1
  12. 中文复杂句语义角色标注,TP391.1
  13. 语义角色标注中的关键技术研究,TP391.1
  14. 基于结构学习的语义角色标注,TP391.1
  15. 网络舆情信息挖掘关键技术研究与应用,TP393.09
  16. 汉语动词“买”的句法语义分析,H146
  17. 基于语义角色标注的中文问答系统研究,TP391.1
  18. 基于格框架的机器翻译,TP391.2
  19. 基于频响函数的动力学模型修正方法研究,O342
  20. 液化煤层气装置除氧氮精馏塔稳态动态模拟及智能控制,TD845

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com