学位论文 > 优秀研究生学位论文题录展示
基于本体的语义搜索技术研究与实现
作 者: 颜婷
导 师: 虞歌
学 校: 杭州师范大学
专 业: 计算机应用技术
关键词: 语义搜索 本体 语义查询扩展 检索排序
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 91次
引 用: 0次
阅 读: 论文下载
内容摘要
互联网的出现,彻底改变了人们对世界的认识,并融入到人们的日常工作生活中,成为人们日常生活中不可或缺的一部分。但随着网络上的各种信息资源的几何级增长,大量的无用的重复的信息对我们选择可用信息带来了障碍与不必要的成本。如何利用网络并高效率的从浩瀚的信息海洋中获取自己满意的信息成为人们关注的问题。搜索引擎的诞生将人们从繁重低效的人工检索中解脱出来,提高了用户查找信息的效率。但是传统的信息检索技术由于缺乏对信息资源的语义理解,越来越不能满足用户的需求。因此基于语义的搜索技术成为目前研究的热点。本文在现有的语义搜索技术基础上,对基于本体的语义搜索进行了深入研究,主要工作如下:(1)研究语义搜索涉及到的关键技术,如资源采集、本体构建、语义标注、用户查询语义扩展及查询排序等。(2)针对用户查询词表达模糊以及传统搜索引擎只是机械的关键字匹配而缺乏语义的缺点,提出一种基于结构化的本体扩展方法,对用户的查询词进行语义处理,并采用本体概念连通图对用户查询进行语义扩展,提高了搜索的查全率和查准率。(3)设计了一种基于链接关系的排序优化算法,对查询返回的结果集进行排序,以便使用户最先获得与其查询意图最相关的结果,得到更好的检索结果。(4)对算法进行验证与分析。在搜索引擎开发框架Lucene基础上,实现具有语义检索功能的原型系统,并以此验证本文所提出的算法的有效性。总之,基于语义的信息检索无论是在理论上还是应用上都具有重要的价值,如何进一步把这项研究推向实际应用中,为用户提供个性化的语义搜索,是我们今后的工作目标与美好愿望。
|
全文目录
致谢 4-5 摘要 5-6 Abstract 6-8 目录 8-11 1.绪论 11-16 1.1.研究的背景与意义 11-12 1.2.语义搜索技术研究现状 12-14 1.3.本文主要研究内容 14-15 1.4.论文章节安排 15-16 2.语义搜索研究概括 16-32 2.1.语义Web简介 16-17 2.2.本体相关知识 17-23 2.2.1.本体的概念 17-18 2.2.2.本体分类 18-19 2.2.3.本体描述语言 19-23 2.3.语义搜索关键技术 23-31 2.3.1.语义搜索整体框架 23-24 2.3.2.信息资源的采集 24-26 2.3.3.本体构建 26-29 2.3.4.语义标注 29 2.3.5.用户查询语义扩展 29-30 2.3.6.查询结果排序 30-31 2.4.本章小结 31-32 3.用户查询语义扩展 32-40 3.1.查询扩展技术概述 32-34 3.1.1.全局分析(Global Document Analysis) 32 3.1.2.局部分析(Local Analysis) 32-33 3.1.3.局部上下文分析(Local Context Analysis,简称为LCA) 33-34 3.2.基于本体的查询扩展研究 34-35 3.3.基于本体的查询扩展方法 35-38 3.4.实验与分析 38-39 3.5.本章小结 39-40 4.基于链接关系的搜索结果排序算法研究 40-49 4.1.传统的排序算法 40-44 4.1.1.词频位置加权排序算法 40-42 4.1.2.PageRank排序算法 42-43 4.1.3.HITS排序算法 43-44 4.2.基于链接关系的排序算法 44-46 4.3.实验与分析 46-48 4.4.本章小结 48-49 5.基于语义的搜索系统设计与实现 49-68 5.1.语义搜索系统开发工具 49-54 5.1.1.本体构建工具Protege 49-50 5.1.2.语义解析工具Jena 50-51 5.1.3.搜索引擎开发框架Lucene 51-54 5.2.系统总体架构 54-56 5.3.语义搜索系统设计 56-64 5.3.1.网络爬虫 56-58 5.3.2.数据解析 58 5.3.3.建立索引 58-60 5.3.4.语义扩展 60-62 5.3.5.数据检索 62-63 5.3.6.结果排序 63-64 5.4.语义搜索系统实现 64-67 5.4.1.开发环境 65 5.4.2.系统界面 65-67 5.5.本章小结 67-68 6.总结与展望 68-70 6.1.本文主要工作总结 68 6.2.未来工作展望 68-70 参考文献 70-75 攻读硕士研究生期间主要的研究成果 75
|
相似论文
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 本体在智能小区中的应用研究,TP391.1
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 情景应对模式下数字化应急预案的语义模型研究,TP391.1
- 一种基于语义的建筑工程质量检测方法研究,TP391.1
- 基于本体的医学命名实体识别技术研究,TP391.1
- 基于本体的方剂推荐系统模型研究与应用,TP391.3
- 基于本体的智能电网知识检索系统,TM76
- 基于本体的可信Web服务组合研究,TP393.09
- 基于自然语言打印机人机交互方法研究与实现,TP11
- 蛋白质关系网络复合物发现与可视化研究,TP391.41
- 基于关系数据库的OWL本体的提取与存储研究,TP391.1
- 基于语义的Web服务匹配研究,TP393.09
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|