学位论文 > 优秀研究生学位论文题录展示
面向自然语言处理的汉语句子语义知识库构建研究
作 者: 刘金凤
导 师: 亢世勇
学 校: 鲁东大学
专 业: 汉语言文字学
关键词: 自然语言处理 句子 语义知识库 语料库
分类号: H13
类 型: 硕士论文
年 份: 2009年
下 载: 148次
引 用: 2次
阅 读: 论文下载
内容摘要
面向自然语言处理的汉语句子语义知识库的构建研究,不仅能够深化现代汉语语义研究,而且对推动自然语言处理的发展具有重要意义。本文在分析和总结国内外现有句子语义资源的基础上,根据中文信息处理的需要,本着适应自然语言处理的发展、面向应用和符合汉语本身特点的原则,提出了一个面向自然语言处理的汉语句子语义知识系统,以此为基础进行了汉语句子语义知识库构建的理论研究和建库实践探索。论文共分五章,各章节的内容安排如下:第一章绪论。从建库目标、方法论、标注内容、系统构成及成果应用等角度详细介绍了国内外构建的几个重要的句子语义资源,总结提出汉语句子语义资源建设中存在的问题,并且陈述了本研究的意义与价值,明确了研究思路。第二、三、四章是论文的主体内容。第二章自然语言处理需要的句子语义知识。分析自然语言处理对语言知识尤其是句子语义知识的要求,构拟出面向自然语言处理的汉语句子语义知识系统,该系统由句内语义知识系统和句间语义知识系统两个子系统构成,并介绍了这两个子系统的主要构成要素。第三章句内语义知识库。首先对句内语义知识库的核心要素——语义角色做了详细分析,讨论了语义角色精细等级、数量设置和分类等内容,提出语义角色体系的评价标准。然后介绍了汉语句法语义标注库构建的相关内容,如建库目标、原则、方法、流程、语料来源、标注信息等。最后对句法语义标注过程中的具体问题及解决策略作了说明。第四章句间语义知识库——文本蕴涵库。总结国外研究成果,提出汉语文本蕴涵的内涵和类型,详细介绍了汉语文本蕴涵库的建库目的、方法、流程、语料来源、标注信息、质量保证等,并在建成的汉语文本蕴涵库的基础上做了统计分析。第五章结语。总结本课题的研究成果和不足,并指出下一步的研究任务。本文的创新之处在于:着眼于自然语言处理的需要,在句子层面从句内和句间两个角度来构建汉语语义知识库,既有理论研究又有实践探索,能够为中文信息处理提供可用的知识系统,并为今后大规模句子语义知识库的构建积累经验、提供借鉴。
|
全文目录
摘要 9-10 Abstract 10-12 第一章 绪论 12-22 第一节 句子语义知识库研究现状 12-19 1.1.1 国外构建的句子语义知识库 12-14 1.1.2 国内构建的句子语义知识库 14-19 1.1.3 小结 19 第二节 研究意义和价值 19-20 1.2.1 深化现代汉语语义研究 19-20 1.2.2 推进自然语言处理发展 20 第三节 研究思路 20-22 第二章 自然语言处理需要的句子语义知识 22-36 第一节 自然语言处理对语言知识的要求 22-26 2.1.1 适应自然语言处理的发展 22-23 2.1.2 面向应用 23 2.1.3 符合汉语特点 23-26 第二节 句子语义知识系统 26-36 2.2.1 语义知识 26 2.2.2 句子层面的语义知识 26-34 2.2.3 面向自然语言处理的汉语句子语义知识系统 34-36 第三章 句内语义知识库 36-73 第一节 目标动词 36-38 3.1.1 词形和词义的一对多关系 36 3.1.2 动词的事件载体性 36-37 3.1.3 目标动词义项标注 37-38 第二节 语义角色 38-46 3.2.1 现有语义角色体系 38-42 3.2.2 语义角色的精细等级、数量设置和分类 42-44 3.2.3 语义角色体系评价标准 44-46 第三节 汉语句法语义标注库的构建 46-52 3.3.1 建库目标和原则 46 3.3.2 构建方法和流程 46-47 3.3.3 语料来源 47-48 3.3.4 标注信息 48-51 3.3.5 标注样例 51-52 3.3.6 汉语句法语义标注库概况 52 第四节 汉语句法语义标注问题及解决策略 52-73 3.4.1 句法语义标注原则 52-54 3.4.2 目标动词事件载体性的判定 54-56 3.4.3 语义角色、情态的标注 56-65 3.4.4 省略和指代处理 65-67 3.4.5 几种特殊结构的处理 67-70 3.4.6 中心词的标注 70-73 第四章 句间语义知识库——文本蕴涵库 73-100 第一节 文本蕴涵研究现状 73-79 4.1.1 文本蕴涵识别国际评测 73 4.1.2 文本蕴涵的类型 73-76 4.1.3 文本蕴涵的获取方法 76-78 4.1.4 文本蕴涵的推理模型 78-79 第二节 汉语文本蕴涵的内涵和类型 79-85 4.2.1 汉语文本蕴涵的内涵 79-82 4.2.2 汉语文本蕴涵的类型 82-85 第三节 文本蕴涵库的构建 85-95 4.3.1 建库目的和方法 85-86 4.3.2 构建流程 86-87 4.3.3 语料来源和标注信息 87-90 4.3.4 质量保证 90-91 4.3.5 标注样例 91-95 第四节 汉语文本蕴涵库的统计分析 95-100 4.4.1 汉语文本蕴涵库概况 95 4.4.2 汉语文本蕴涵统计分析 95-100 第五章 结语 100-101 参考文献 101-106 附录 106-121 攻读硕士学位期间发表论文清单 121-122 致谢 122
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 面向主题的Web文档自动文摘生成方法研究,TP391.1
- 汉语框架自动识别中的歧义消解,TP391.1
- 基于中介语语料库的汉语递进复句习得研究,H195
- 基于语料库的上海世博会新闻报道的互文性分析,H052
- 基于语料库对TAKE用法的比较研究,H319
- 智能答疑系统中句子相似度计算的研究与应用,TP391.1
- 中国大学生英语作文中SO使用情况的语料库分析,H319
- 基于语料库的中外学术语篇中立场副词对比研究,H314
- 基于语料库的中国英语经济新闻报道中概念隐喻的研究,H315
- 中外英文学术语篇中词块的结构和功能对比研究,H315
- 学术主页信息抽取系统的研究,TP393.092
- 现代汉语功能句型及其语料库建设,H146
- 英语学术论文标题的短语学特征研究,H313
- 基于自然语言打印机人机交互方法研究与实现,TP11
- 基于语料库的中美经济语篇批评分析,H052
- 基于物流专业词汇联想测试的心理词库研究,H319
- 基于语料库的英语专业学习者书面语中心理使役动词使用研究,H319
- 中美语言学硕士论文中因果标记语的对比研究,H313
- 中国政府文件中国特色英语词丛研究,H313
- 基于语料库对科技英语次技术词用法的研究,H314
中图分类: > 语言、文字 > 汉语 > 语义、词汇、词义(训诂学)
© 2012 www.xueweilunwen.com
|