学位论文 > 优秀研究生学位论文题录展示
对搜索引擎扩充语义信息功能方法研究
作 者: 毛敏芹
导 师: 顾君忠
学 校: 华东师范大学
专 业: 计算机技术
关键词: 搜索引擎 语义web 本体 WordNet
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 62次
引 用: 0次
阅 读: 论文下载
内容摘要
随着Internet的快速发展,Web信息的迅速增加,人们越来越多地依赖于通过搜索引擎来获取互联网上的信息。遗憾的是,目前的大多数搜索引擎采用的都是单纯的对关键词进行匹配的检索方式,并没有深入到语义层面以理解用户的真正意图。因此,如何更好的理解用户的搜索请求、提供语义联想的搜索方式已成为新一代搜索引擎系统亟待解决的问题之一。本文对语义搜索引擎系统中的若干关键技术进行了较为深入的研究,主要包含以下几点:(1)提出了一种基于WordNet词典的本体半自动构建方法。目前大多数的本体构建方法都是通过人工方式构建,人工构建本体是一项艰巨的过程,不仅需要大量的人力、物力,而且整个过程都需要领域专家的参与。另一方面,由于领域内的概念及概念之间的关系定义是一件很棘手的事情,所以要完全自动化的生成本体的难度相当大。本文利用现有的WordNet提出了一种半自动的本体生成方法。(2)提出了本体描述性的定义,就其中的概念之间的传递性和继承性关系进行了阐述。本体包含五个基本建模元语,即概念、关系、函数、公理、实例,通过对这五个建模元语分析,给出本体的部分形式化定义,同时描述了关系的传递性和继承性,根据这些关系属性的逻辑性,可以推理出所需查找的概念。(3)提出了关系属性的逻辑推理机制,给出了本体中概念之间的is_a和part_of关系的推理规则。有了这些推理规则,我们就可以在构建好的本体库中找出与概念存在is_a和part_of关系的概念。(4)提出了一种添加了part_of关系推理的基于本体的搜索引擎模型,它能够从语义层面上对网页进行语义理解和对用户的查询条件进行语义扩展和分析,使用户的需求得到更大化的满足。
|
全文目录
摘要 6-7 ABSTRACT 7-11 第1章 绪论 11-14 1.1 研究背景 11 1.2 研究目的与意义 11-12 1.3 本论文的主要工作 12 1.4 论文结构 12-14 第2章 对目前国内外流行的搜索引擎分析 14-21 2.1 搜索引擎原理和工作流程 14-16 2.1.1 搜索器 14-15 2.1.2 索引器 15-16 2.1.3 检索器 16 2.1.4 用户接口 16 2.2 国内外搜索引擎的特点及不足 16-19 2.2.1 Google 16-17 2.2.2 Yahoo! 17-18 2.2.3 百度 18-19 2.3 搜索引擎的发展趋势 19-21 第3章 语义web及其相关技术 21-26 3.1 语义web的诞生 21 3.2 语义web的概念 21-22 3.3 语义web的体系结构 22-24 3.4 语义web的应用 24-26 第4章 本体知识库的构建 26-34 4.1 本体的概念 26-27 4.2 本体的类型 27-28 4.3 本体的建模元语 28-29 4.4 本体构建的方法 29-34 4.4.1 "骨架"法 29-30 4.4.2 TOVE企业建模法 30-31 4.4.3 Berneras et al.(KACTUS工程)方法 31 4.4.4 METHONTOLOGY方法 31-32 4.4.5 循环获取法 32-34 第5章 基于WordNet的本体构建 34-41 5.1 WordNet简介 34-35 5.2 WordNet中的关系 35-36 5.3 基于WordNet构建本体方法 36-39 5.4 本体构建方法比较 39-41 第6章 基于本体的搜索引擎语义扩充模型 41-47 6.1 系统简介 41 6.2 系统架构分析 41-46 6.2.1 查询模块 42 6.2.2 推理引擎 42-45 6.2.3 本体知识库 45 6.2.4 检索模块 45 6.2.5 索引器 45 6.2.6 搜集器 45-46 6.3 系统特点 46-47 第7章 总结与展望 47-49 7.1 总结 47 7.2 展望 47-49 参考文献 49-53 致谢 53
|
相似论文
- 哲学思想在指导中学数学教学中的作用,G633.6
- 面向业务过程的服务动态组合方法研究,TP393.09
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 网络搜索引擎的相关技术研究,G354
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 基于语义网络的智能搜索引擎研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 基于语义的Web服务发现研究,TP393.09
- 本体在智能小区中的应用研究,TP391.1
- 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中数据资源之间关联关系发现模型研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|