学位论文 > 优秀研究生学位论文题录展示
基于WordNet和FrameNet的领域语义词典的构建研究
作 者: 毕焕欢
导 师: 庄超
学 校: 华中师范大学
专 业: 计算机应用技术
关键词: 机器词典 情境搜索 属性参数 规则 领域语义词典
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 113次
引 用: 0次
阅 读: 论文下载
内容摘要
使用电子计算机来处理自然语言,每一步都需要机器词典的协助。信息抽取、词义消歧、信息检索、机器翻译、智能问答系统、人机对话等所有的计算语言学自动处理技术解决问题的前提是拥有一部或多部涵盖相应语言知识的机器词典。机器词典是一个知识库,只有具备了知识库中的知识才能够处理语言问题。机器词典是计算语言学应用的前提。构建实用的有效的电子词典,一直是自然语言处理方向的重点研究问题,也是计算机智能化的关键技术问题。一直以来,中外的计算语言学者对机器词典的构建思想和构建方法各持己见,所以机器词典的构造方法方式多种多样,能够使用并解决问题的却非常少。除了WordNet和FrameNet鲜有词典能够一直发展使用。本文作者从人类认知的角度出发,从人类大脑对知识的理解角度进行探索,并结合WordNet和FrameNet的词典构造原理,提出了一套构建领域词典的方法。本文所作的主要工作如下:(1)通过研读大量文献资料,理清了词典的发展历史,理清了词典和其他知识的关系,包括语言学,认知科学,认知语言学以及词典演变过程中出现的一门相对独立的科学——词典学。(2)在以往的文献资料的基础上,对WordNet和FrameNet进行了更细致和深入的剖析。对同义词集和框架语义学进行了详细的阐述,并从中获得了启发,以Gruber题元角色理论、G.Miller同义词集理论、Charles J.Fillmore格理论和框架语义学理论为基础提出了自己的一套观点,建立基于WordNet和FrameNet的领域语义词典。(3)说明了领域词典中从知识库到词汇模块的数据组织方式。采用尾字哈希表-词长索引表-词条链表模式。给出了词典中词的具体存放方式,并且给出了具体的词汇单元块模型。(4)将设计的领域语义词典用于分词系统和场景搜索中,利用词汇单元本身记录的角色选择限制信息通过检测谓词论元的匹配问题来解决分词中最大的障碍——歧义问题。场景搜索通过相关算法匹配词汇的静态和动态属性,设定阈值,显示最终结果词汇
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-13 1.1 研究背景 10 1.2 机器词典的研究意义 10-11 1.3 国内外机器词典的研究现状 11 1.4 本论文的组织 11-13 第2章 探究与词典相关的理论知识 13-27 2.1 词典和语言的关系 13 2.2 词典与词典学 13-15 2.3 词典与认知科学,认知语言学 15 2.4 语义框架 15-16 2.5 词典的历史演变、类型、结构和功能 16-19 2.5.1 国外词典的发展史 17-19 2.5.2 我国词典发展史 19 2.6 WordNet和FrameNet综述 19-27 2.6.1 WordNet 20-23 2.6.2 FrameNet简介 23-27 第3章 领域语义词典的设计思想 27-37 3.1 通用和专用结合的思想 27-28 3.2 领域语义词典的理论基础 28-30 3.3 领域语义词典模型 30-35 3.3.1 词典的整体组织方式 30 3.3.2 词典的分层数据结构及理论依据 30-35 3.4 词典中词类划分 35-36 3.5 领域词典的收词原则 36-37 第4章 词语概念参数的设置方法 37-44 4.1 词语的属性 37-40 4.1.1 属性的定义 37 4.1.2 属性值元素 37 4.1.3 静态属性和动态属性 37-40 4.2 动词句法特征规则化 40-44 第5章 领域语义词典的设计实例及应用 44-57 5.1 领域语义词典实例 44-49 5.2 领域语义词典用于分词系统 49-53 5.3 领域语义词典用于场景搜索 53-57 第6章 总结与展望 57-59 参考文献 59-62 致谢 62-63 附录 63-64 在校期间发表的论文、科研成果等 64
|
相似论文
- 基于非规则LDPC码的BICM系统优化设计,TN911.2
- 从历届世界健美操规则看健美操难度动作发展态势,G831.3
- UML模型到XMI的映射方法研究,TP311.5
- C++代码缺陷检测系统的研究与设计,TP311.53
- 排球竞赛规则修改的演变对排球运动发展的影响,G842
- 基于数据挖掘的税务稽查选案研究,F812.42
- 对女子竞技体操比赛技术制胜因素的研究,G832
- 基于多尺度分析的图像融合算法研究,TP391.41
- 基于邻域关系的模糊决策系统约简与规则获取,TP18
- 传闻证据规则研究,D925.2
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 我国刑事法庭证人作证的问题与完善,D925.2
- 通信行为指纹研究,TP311.13
- 双层车库车辆调度辅助决策支持系统,TP242
- 基于FNN的电压力锅控制系统研究与设计,TM925.5
- 我国质量技术监督行政处罚证据制度研究,D922.1
- 自动光学检测专家系统设计及实现,TP182
- 论我国承认与执行外国仲裁裁决的程序规则,D925.1
- 多人共站装配线平衡问题的研究与优化,TG95
- 基于OSG的三维不规则军标地形匹配应用研究,E919
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|