学位论文 > 优秀研究生学位论文题录展示
基于语义网络的智能搜索引擎研究
作 者: 孟骁
导 师: 林和平
学 校: 东北师范大学
专 业: 计算机软件与理论
关键词: 语义爬虫 语义扩展 搜索引擎
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 31次
引 用: 0次
阅 读: 论文下载
内容摘要
伴随着信息化时代的到来,万维网(WWW)已经成为人们日常生活中非常重要的信息源。但是随着网络信息覆盖面逐渐扩大,增长速度不断加快,人们对获取信息的快捷性要求也越来越高。互联网用户要求搜索引擎能够提供更加专业和个性化的服务,此时传统的搜索引擎就显得力不从心了。本体技术作为一种先进的知识表示技术具有良好逻辑推理支持能力和较为完善的概念层次结构。近些年来,将本体技术应用于搜索引擎当中创造出的基于本体的语义搜索引擎开始受到人们的关注。基于语义的搜索引擎能够更好的理解用户的需求从而提供更加精准的分类和智能化的网络服务。本论文首先介绍了搜索引擎的国内外现状及基本功能,然后分析了语义爬虫的爬行原理,并重点分析了现阶段语义爬虫的搜索策略及其劣势。在利用“七步法”构建食品本体的前提下,并综合分析以上问题,提出了一种基于本体的语义拓展算法。在对网页进行少量预处理的前提下,利用本体解析结果生成爬行规则,不仅能够在搜索时获得更好的准确率和召回率,而且能够对爬行出的网页进行一定的推理。实验结果表明该系统可以有效地提高搜索的准确率和召回率。
|
全文目录
摘要 4-5 Abstract 5-6 目录 6-7 第一章 引言 7-10 1.1 研究背景及意义 7-8 1.2 搜索引擎技术现状与分析 8 1.3 论文内容介绍 8-10 第二章 相关理论知识 10-16 2.1 本体的介绍 10-12 2.1.1 本体的概念 10-11 2.1.2 本体描述语言 11-12 2.2 本体的构建 12-14 2.2.1 本体构建工具 13-14 2.3 基于本体的网络爬虫相关技术及理论概述 14-15 2.3.1 爬虫工作原理 14-15 2.4 本体爬虫模型 15-16 第三章 基于领域本体的语义爬虫总体设计 16-20 3.1 关于语义爬虫 16 3.2 语义爬虫性能评价指标 16-17 3.3 基于领域本体的语义爬虫系统设计 17-20 3.3.1 系统设计的目标 17 3.3.2 系统框架结构 17-18 3.3.3 系统功能模块 18-20 第四章 语义爬虫的设计实现 20-27 4.1 乳制品领域本体的构建 20-22 4.2 页面预处理模块 22-24 4.3 语义扩展模块 24 4.4 语义扩展算法 24-25 4.5 实验结果及分析 25-27 第五章 总结与展望 27-28 5.1 论文总结 27 5.2 研究展望 27-28 参考文献 28-30 致谢 30-31 在学期间公开发表论文及著作情况 31
|
相似论文
- 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
- 论搜索引擎竞价排名的法律规制,D923.43
- 基于本体的智能答疑系统研究与实现,TP311.52
- 对搜索引擎扩充语义信息功能方法研究,TP391.3
- 基于用户兴趣模型的个性化搜索引擎研究与分析,TP391.3
- 基于倒排索引的压缩算法性能研究,TP391.3
- 个性化多媒体资源垂直搜索引擎技术研究,TP391.3
- 基于Web数据挖掘的搜索引擎设计与实现,TP391.3
- 基于元搜索的Web网络军事情报信息搜索技术研究,TP391.3
- 以博客内容为对象的个性化搜索研究,TP391.3
- 基于剪枝策略的中国象棋搜索引擎研究,TP391.3
- 个性化技术资料支持帮助系统的研究与实现,F49
- 基于本体的可伸缩的社会网络抽取算法的研究,O157.5
- 多义拟声拟态词语义扩展机制分析,H36
- 企业搜索引擎中网页分类技术的研究与实现,TP393.092
- 基于二次搜索的搜索引擎技术研究,TP391.3
- 领域文本相似度计算方法研究,TP391.1
- 面向中医药的多元语义搜索引擎,TP391.3
- 搜索引擎的研究与设计,TP391.3
- 个性化搜索引擎的研究与设计,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|