学位论文 > 优秀研究生学位论文题录展示
基于句法特征的代词消解方法研究
作 者: 宋巍
导 师: 秦兵
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 代词消解 句法分析 归纳逻辑编程 结构化句法特征 词义相似度
分类号: TP391.1
类 型: 硕士论文
年 份: 2008年
下 载: 39次
引 用: 0次
阅 读: 论文下载
内容摘要
篇章或对话中大量出现的指代,是自然语言中常见的语言现象,它使得句子更加简明,主题更加突出,这也给计算机理解自然语言增加了难度。指代消解一直是自然语言理解中的核心问题,在机器翻译、信息抽取、自动文摘以及自动问答等领域中都有重要应用。对于代词消解,包含代词与候选先行词的句法分析树可以提供丰富的句法信息,但其结构复杂,不易表示,传统的方法都是基于语言学知识,人工地、启发式地选择与构建特征集合,如候选先行语的句法角色,候选先行语与指代语之间的绑定约束特征等。这类方法的局限性在于:过于依赖研究者的语言学背景;难以发现和有效利用句法结构中的潜在信息;对代词与候选先行词单独建模没有考虑上下文中其他成分的作用。本文着重研究怎样有效地利用句法信息支持代词消解。针对如何有效表示句法结构特征,如何利用句法发现上下文中其他有益信息等问题,提出了三种方案:一阶谓词逻辑能够表达个体间的关系的特点,将结构化的句法信息转化为句法路径上的结点属性与结点和结点之间的关系,将这些属性与关系用一组谓词来表示,结合归纳逻辑编程自动构建逻辑程序,以直接、显现的方式使用背景知识、学习假设来解决指代消解问题。将代词与候选线性词之间的句法分析树路径结构整体作为结构化的特征,利用Tree Kernel函数计算句法树结构之间的相似度,与一般特征结合来训练分类器进行消解。句法分析不仅仅给出一个句子的层次结构而且可以传递词语之间的关系。本文还利用依存句法分析找到分别找到代词与候选先行词的支配词,计算他们之间的词义相似、相关特征训练分类器来支持代词消解。本文的贡献即在于尝试有效的句法分析树的表示方法构造结构化句法特征;通过句法分析利用上下文中其它词汇的词义属性来支持代词消解。
|
全文目录
摘要 4-5 Abstract 5-10 第1章 绪论 10-17 1.1 课题背景 10-11 1.2 相关概念 11 1.3 研究现状 11-16 1.3.1 基于语言学方法的共指消解 11-13 1.3.2 基于机器学习方法的共指消解 13-16 1.4 本文研究内容 16-17 第2章 基于逻辑句法表示的代词消解 17-29 引言 17 2.1 归纳逻辑编程 17-21 2.1.1 一阶谓词逻辑 18-19 2.1.2 归纳逻辑编程 19-21 2.2 系统框架 21 2.3 关系谓词表示句法树结构 21-23 2.4 一般特征 23-25 2.5 实验设置与结果分析 25-28 2.5.1 Aleph系统与假设置信度计算 25-26 2.5.2 实验语料 26-27 2.5.3 训练与测试实例构建 27 2.5.4 评价方法 27 2.5.5 实验结果分析 27-28 2.6 本章小结 28-29 第3章 基于Kernel与结构化特征的代词消解 29-37 引言 29 3.1 系统框架 29-30 3.1.1 特征空间 30 3.1.2 支持向量机 30 3.2 结构化句法特征 30-33 3.3 Tree Kernel应用于结构化特征 33-34 3.3.1 Tree Kernel 33 3.3.2 组合Kernel 33-34 3.4 实验设置与结果分析 34-36 3.4.1 实验设置 34 3.4.2 实验结果 34-36 3.5 本章小结 36-37 第4章 句法与词义结合的代词消解 37-45 引言 37 4.1 依存语法与依存句法分析 37-38 4.2 HowNet简介 38-39 4.3 系统框架 39-40 4.4 一致性约束过滤和训练、测试实例构建 40-41 4.5 特征选择 41-42 4.5.1 支配词的词义特征 41 4.5.2 句法角色特征 41-42 4.5.3 一般特征 42 4.6 实验设置与结果分析 42-44 4.6.1 语料 42 4.6.2 评价方法 42 4.6.3 实验分析 42-44 4.7 本章小结 44-45 第5章 三种方法的比较分析 45-50 引言 45 5.1 基于逻辑句法表示方法与SVM结合Kernel方法的比较 45-47 5.1.1 学习算法的比较 45-46 5.1.2 两种句法特征表示方法的比较 46-47 5.2 基于依存分析的词义特征对代词消解的作用 47-49 5.3 本章小结 49-50 结论 50-51 参考文献 51-55 攻读学位期间发表的学术论文 55-57 致谢 57
|
相似论文
- 面向统计机器翻译的解码算法的研究,TP391.2
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 语义网自动构建中句法分析的研究,TP391.1
- 基于空间句法分析的城市地价与合理用地结构关系研究,F224;TU984.113
- 统计机器翻译中层次短语翻译模型的研究与实现,TP391.2
- 基于贝叶斯分类方法的中文问句分类研究,TP391.1
- 基于数据库的自然语言查询技术研究与实现,TP391.1
- 基于知网和贝叶斯模型的词义消岐技术的研究,TP391.1
- 中文问答系统中问题分析关键技术的研究,TP391.1
- 基于条件随机场的汉语短语识别研究,TP391.1
- “二程语录”被动式研究,H146
- 汉语联合短语结构分析与识别,H146
- 基于领域词典的汉语语块分析的研究,TP391.1
- 否定标记“没有”的句法语义分析,H146
- “没A没B”格式分析,H146
- 结构化支持向量机学习方法及应用研究,TP18
- 新闻语料中名词短语识别的研究,TP391.43
- 基于情感分析的新闻浏览平台关键技术研究,TP391.1
- 基于主动学习的汉语依存树库构建,TP391.1
- 语义角色标注的集成策略的研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|