学位论文 > 优秀研究生学位论文题录展示
指代消解关键问题研究
作 者: 孔芳
导 师: 钱培德
学 校: 苏州大学
专 业: 计算机应用技术
关键词: 指代消解 中心理论 语义角色 树核函数 待消解项识别
分类号: TP301
类 型: 博士论文
年 份: 2009年
下 载: 202次
引 用: 5次
阅 读: 论文下载
内容摘要
随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。指代消解是自然语言处理的重点和难点之一,在文本摘要、机器翻译、多语言信息处理和信息抽取等诸多应用中都涉及到指代消解问题。而指代消解又综合了多种自然语言处理技术,它的解决依赖于词性标注、命名实体识别、名词短语识别、句法分析、语义分析等众多相关技术。本文首先深入分析了现有的指代消解技术,并对其进行了归纳总结,给出了目前指代消解领域主要存在的问题和不足,并进一步给出了该领域当前的研究热点和趋势。作为研究基础,本文参考Soon等(2001)给出的经典指代消解基本框架构建了一个性能良好的指代消解基准平台,与国际上一些出色的指代消解系统相比,该平台在MUC-6和ACE2003上的性能均达到了国际领先水平。在此基础上,本文从以下三方面展开了深入研究:第一,基于中心理论的指代消解研究。在中心理论的指导下,借助语义角色将中心理论从语法层扩展到语义层,并提取了与之相关的三组特征:语义角色特征,代词阶特征和代词子类别特征。在ACE 2003语料上进行的各类实验都表明,这三组特征能极大地提升了指代消解的性能,特别是代词消解的性能。同时,实验也表明,它们不仅对短距离指代关系的消解有益,对长距离指代关系的消解也很有帮助。第二,基于树核函数的指代消解研究。在深入研究平面特征的基础上对结构化信息在指代消解中的应用进行了探索。重点研究了多种捕获结构化信息的方案,并通过实验分析了它们的优缺点。例如,在中心理论的指导下,增强了先行语候选词所在位置的句法描述;根据双候选模型,增加了先行语候选词的竞争者信息;在结构化信息中引入语义角色及代词类别等信息。在ACE 2004英文语料中的实验表明,基于树核函数的方法大大提高了英文指代消解的性能,特别是当前句代词消解的性能。同时,在ACE 2005中文语料中的实验表明,基于树核函数的方法同样大大提高了中文指代消解的性能,这表明结构化信息对指代消解而言是非常重要的,而且是语言无关的。第三,指代消解中待消解项的自动识别研究。探讨了基于规则、平面特征和树核等三种待消解项识别方法,并将这三种待消解项识别方法分别应用于指代消解,通过对实验数据的分析阐述了待消解项识别对指代消解的作用。
|
全文目录
中文摘要 3-5 Abstract 5-11 第一章 引言 11-32 1.1 课题背景及意义 11-15 1.1.1 课题背景 11-14 1.1.2 课题意义 14-15 1.2 指代消解基础知识 15-22 1.2.1 指代的基本概念 15-17 1.2.2 指代消解语料资源 17-20 1.2.3 指代消解评测 20-22 1.3 研究现状及分析 22-28 1.3.1 国外研究现状 23-25 1.3.2 国内研究现状 25-26 1.3.3 存在的问题和不足 26-27 1.3.4 研究的热点和趋势 27-28 1.4 本文的主要工作及解决的问题 28-30 1.5 本文的组织结构 30-32 第二章 基于机器学习的指代消解平台 32-56 2.1 指代消解平台概述 32-33 2.2 指代消解平台的构建 33-42 2.2.1 预处理 33-38 2.2.2 特征向量的选择 38-39 2.2.3 实例的生成 39-42 2.3 机器学习方法 42-49 2.3.1 基本原理 43-47 2.3.2 核 47-48 2.3.3 特点及优势 48-49 2.4 实验结果及分析 49-55 2.4.1 与其它指代消解系统的比较 49-50 2.4.2 各特征对指代消解的贡献度分析 50-51 2.4.3 按名词类别的指代消解性能分析 51-53 2.4.4 对代词指代消解性能的分析 53-55 2.5 本章小结 55-56 第三章 指代消解中语义角色的应用研究 56-76 3.1 语义及相关研究 56-58 3.2 语义角色及其应用研究 58-62 3.2.1 语义角色的基础知识 59-60 3.2.2 语义角色的应用研究 60-62 3.3 中心理论及相关研究 62-65 3.3.1 中心理论的基础知识 62-64 3.3.2 中心理论的相关研究 64-65 3.4 中心理论指导下语义角色在指代消解中的应用 65-70 3.4.1 中心理论的语义层扩展 65-67 3.4.2 语义角色在指代消解中的应用 67-70 3.5 实验结果及分析 70-75 3.5.1 改进系统的性能分析 70-71 3.5.2 改进系统中各组特征对代词消解性能的贡献度分析 71-73 3.5.3 改进系统中代词消解性能分析 73-74 3.5.4 改进系统对SRL 性能的依赖 74-75 3.6 本章小结 75-76 第四章 指代消解中结构化信息的应用研究 76-102 4.1 平面特征与结构化信息 76-77 4.2 结构化信息的相关研究 77-79 4.3 卷积树核 79-81 4.4 基于结构化信息的指代消解研究 81-85 4.4.1 句法树的基本裁剪策略 82-83 4.4.2 实验结果及分析 83-85 4.5 基于动态扩展树的指代消解研究 85-92 4.5.1 动态扩展策略 85-90 4.5.2 实验结果及分析 90-92 4.6 基于语义扩展树的指代消解研究 92-94 4.6.1 语义扩展策略 92-93 4.6.2 实验结果及分析 93-94 4.7 进一步分析 94-98 4.7.1 不同句法分析器的影响 95-96 4.7.2 两句内的代词指代消解 96-97 4.7.3 与基于特征的指代消解平台的合并 97-98 4.8 基于树核的中文指代消解 98-100 4.9 本章小结 100-102 第五章 指代消解中待消解项识别的研究 102-119 5.1 待消解项识别的相关研究 102-103 5.2 基于规则的待消解项识别研究 103-105 5.3 基于特征的待消解项识别的研究 105-110 5.3.1 待消解项识别分类器的构建 105-106 5.3.2 实验及分析 106-110 5.4 基于树核的待消解项识别的研究 110-115 5.4.1 裁剪策略 110-111 5.4.2 实验及分析 111-115 5.5 待消解项识别对指代消解的作用 115-118 5.6 本章小结 118-119 第六章 小结与展望 119-122 参考文献 122-128 攻读博士学位期间相关的科研论文情况 128-131 致谢 131-132 详细摘要 132-141
|
相似论文
- 基于马尔可夫逻辑网络的语义角色标注,TP391.1
- 基于多中心理论的公共水污染危机治理研究,X52
- 现代汉语中表遭受语义的句模研究,H146
- 基于待消解项识别的全局优化共指消解方法研究,TP391.1
- 语义角色标注的集成策略的研究,TP391.1
- 基于Web的比较观点挖掘方法研究,TP391.1
- 基于依存关系的中文语义角色标注研究,TP391.1
- 中文跨文档指代消解的研究与实现,TP391.1
- 中文零指代消解研究,TP391.1
- 命名实体与基本名词短语识别研究,H08
- 汉语指量结构和关系小句的位序研究,H146
- 基于依存句法分析的语义角色标注,TP391.1
- 基于条件随机场模型的汉语框架语义角色自动标注研究,TP391.1
- 面向话题的事件信息融合研究与实现,TP202
- 面向三维场景生成的中文语义角色标注方法研究,TP391.1
- 基于特征向量的中文指代消解研究与系统实现,TP391.1
- 中文口语中的指代消解及省略语句补全,TP391.1
- 基于汉语框架网的问句语义角色标注研究,TP391.1
- 基于支持向量机的汉语框架语义角色自动标注,TP391.1
- 基于最大熵模型的汉语框架语义角色自动标注,TP391.1
- 基于条件场的语义角色标注,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法
© 2012 www.xueweilunwen.com
|