学位论文 > 优秀研究生学位论文题录展示
基于叙词表的领域本体构建方法研究
作 者: 李梦莎
导 师: 姜同强
学 校: 北京工商大学
专 业: 管理科学与工程
关键词: 本体学习 本体自动构建 叙词表转换 自然语言处理
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 72次
引 用: 0次
阅 读: 论文下载
内容摘要
本体构建的方式可分为两种:一是基于领域专家的手工构建方式;一是基于机器学习的自动/半自动构建方式。前者以人工工作为主体,所构建本体的语义内容依赖于构建者的个人知识,因此这种方式对知识瓶颈问题只是起到了一种缓解作用。而后者是通过机器学习的方式从海量信息中自动获取知识,是从根本上解决本体构建中知识瓶颈问题的重要途径。目前关于本体自动构建方面的研究越来越多,然而本体构建中领域依赖性强、自动化程度低、学习效果不理想等问题尚未得到很好的解决。特别是在中文本体构建方面,国内外对中文本体自动构建的研究非常少。因此,本文在对当前本体构建技术及本体学习方法进行深入研究的基础上,提出一种领域本体自动构建的新思路,并重点研究以下几方面内容:(1)提出一个基于叙词表的领域本体学习系统模型。该模型将叙词表的本体转换技术以及本体学习中关系获取的技术相结合,利用叙词表的固有优势,弥补了本体学习过程中由于概念及分类关系获取效果不佳的问题,并在此基础上通过对纯文本数据源进行关系学习,获取概念间的非分类关系,使得所构建的领域本体具有更丰富的语义信息。(2)设计并实现了基于叙词表的领域本体学习系统。基于叙词表的领域本体学习系统分为叙词表转换模块以及非分类关系学习模块。在叙词表转换模块中,本文总结了一套领域叙词表本体转换的规则,并以此为依据实现了叙词表到领域初始本体的转换。在非分类关系学习模块中,以扩展的关联规则挖掘法为理论依据,利用中文自然语言处理等技术对中文语料库进行关系获取,并将关系学习的结果添加到初始本体之中。(3)用该系统构建领域本体并对其进行评价。目前对本体的评价尚未形成标准,本文仅选用复用性、可扩展性、相关关系参照度等几个指标对本体自动构建结果进行评价。本文设计并实现的基于叙词表的领域本体学习系统,为中文领域本体的自动构建提供了有价值的参考,且对基于中文本体的语义知识具体应用具有积极意义。
|
全文目录
摘要 3-4 ABSTRACT 4-7 第一章 绪论 7-10 1.1 本体构建方法研究的背景及意义 7-8 1.2 本文研究的内容及创新点 8 1.3 本文组织 8-9 1.4 本章小结 9-10 第二章 相关概念及研究现状 10-19 2.1 本体及其相关概念 10-12 2.1.1 本体的基本概念 10-11 2.1.2 本体描述语言简介 11 2.1.3 本体构建方法及工具介绍 11-12 2.2 叙词表转换为本体的研究现状 12-14 2.3 本体学习方法的研究现状 14-17 2.3.1 本体学习方法研究 14-16 2.3.2 本体学习工具简介 16-17 2.4 现阶段存在的问题 17-18 2.5 本章小结 18-19 第三章 基于叙词表的本体学习系统模型 19-24 3.1 本体构建流程提出的必要性 19 3.2 本体构建流程概述 19-21 3.3 基于叙词表的本体学习系统模型 21-23 3.4 本章小结 23-24 第四章 叙词表转换模块设计 24-33 4.1 叙词表分析 24-25 4.2 基于叙词表的本体建模规则 25-29 4.3 叙词表转换模块的设计与实现 29-32 4.3.1 叙词表转换模块视图 29 4.3.2 用JENA 实现叙词表的转换 29-32 4.4 本章小结 32-33 第五章 非分类关系学习模块设计 33-49 5.1 自然语言处理简介 33-34 5.2 分词模块设计与实现 34-39 5.2.1 中文分词技术简介 34-36 5.2.2 分词模块视图 36 5.2.3 使用中科院ICTCLAS 分词工具进行初步分词 36-37 5.2.4 用串频统计方法优化分词结果 37-39 5.3 语义三元组抽取模块设计与实现 39-42 5.3.1 语义三元组抽取模块视图 39-40 5.3.2 基于句法依存树抽取语义三元组 40-42 5.4 三元组净化筛选模块的设计与实现 42-46 5.4.1 三元组净化筛选模块视图 42-43 5.4.2 三元组净化筛选模块设计与实现 43-46 5.5 关系获取模块实现 46-47 5.5.1 关系获取模块视图 46 5.5.2 关系获取模块实现 46-47 5.6 本章小结 47-49 第六章 本体学习系统评价 49-54 6.1 对本体学习系统的分析 49 6.2 本体评价标准及方法 49-50 6.3 对领域本体进行分析评价 50-53 6.4 本章小结 53-54 第七章 结论和展望 54-56 7.1 本文总结 54 7.2 下一步研究工作 54-55 7.3 本章小结 55-56 参考文献 56-58 在学期间发表的学术论文与研究成果 58-59 致谢 59
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 学术主页信息抽取系统的研究,TP393.092
- 基于自然语言打印机人机交互方法研究与实现,TP11
- 基于中文维基百科的语义相关度计算的研究与实现,TP391.1
- 基于话题的多文档文摘技术研究,TP391.1
- 基于丰富特征和多核学习的蛋白质关系抽取,Q51
- 自然语言理解中并列名词歧义消解及其在智能仪器设计领域的应用,TP391.1
- 面向自然语言处理的汉语句子语义知识库构建研究,H13
- 面向网络知识服务的医疗信息分类方法,TP391.1
- 用例图到顺序图转换的研究,TP311.52
- 基于知网和贝叶斯模型的词义消岐技术的研究,TP391.1
- 基于内容的文本分割关键技术,TP391.1
- UML类图转换到OWL DL本体的一种形式化方法的研究,TP391.1
- XML/Schema到OWL DL本体映射的研究,TP391.1
- 基于关系数据库的OWL本体建模技术的研究,TP311.13
- 本体自动构建技术研究及其在教学中的应用,G420
- 基于规则与统计的语气词用法自动识别研究,TP391.1
- 基于本体的话题情感分析研究,TP391.1
- 基于统计的多文档关键短语和文摘抽取研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|