学位论文 > 优秀研究生学位论文题录展示
基于领域本体的语义检索系统研究
作 者: 马中杰
导 师: 郑诚
学 校: 安徽大学
专 业: 计算机软件与理论
关键词: 语义检索 领域本体 语义标注 语义查询扩展
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 42次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络技术的快速发展和网上信息资源的激增,如何在网上迅速而准确的检索出用户所需资源,成为目前信息检索领域所面临的一个关键问题。传统的信息检索系统主要是基于关键字匹配或基于主题分类进行检索,检索时往往会返回大量无关结果,在查全率和查准率上也均不能令用户满意。随着本体的广泛应用,人们尝试利用本体中概念之间的关系来提高检索系统的语义能力,因为本体不仅作为一种能够在语义和知识层次上描述信息系统的概念模型建模工具,而且具有良好的概念层次结构和对逻辑推理的支持。在将本体技术融合到传统的信息检索系统之后,检索技术也从目前基于关键词层面提高到基于知识的层面上来。本文对基于领域本体的语义检索技术进行研究。首先阐述了基于本体的语义检索系统的背景、意义以及国内外研究现状,概述了语义检索和本体的相关概念和理论。接着针对检索所需要的两项关键技术—文档的语义标注和查询扩展进行了深入的研究。在文档的语义标注部分,提出了一种基于领域本体的语义标注改进算法,该算法利用领域本体知识的语义环境和资源文档结构两方面的信息来进行标注。在查询扩展部分也主要是利用领域本体中概念属性关系对用户的查询进行处理,以实现语义上的查询扩展。其次,在以上理论研究的基础上,本文选取100篇服装方面的文档作为实验数据,设计并初步实现了基于服装领域本体的语义检索系统。测试结果表明,该系统在查全率和查准率上都有一定提高。最后,对全文进行总结,并对未来的工作进行了一些展望。
|
全文目录
摘要 3-4 Abstract 4-8 第一章 绪论 8-12 1.1 论文研究的背景及意义 8-9 1.2 基于领域本体的语义检索系统的研究现状 9-10 1.3 研究的主要内容及论文组织结构 10-12 第二章 信息检索和本体的相关理论概述 12-22 2.1 信息检索的概念 12-15 2.1.1 布尔检索模型 13-14 2.1.2 向量空间模型 14-15 2.1.3 概率模型 15 2.2 信息检索技术的发展 15-16 2.3 信息检索的方法 16-17 2.4 本体的相关知识 17-22 2.4.1 本体的概念 17-18 2.4.2 本体的建模元语及关系类型 18-19 2.4.3 本体的表示语言 19-20 2.4.4 本体的构建工具 20-22 第三章 基于领域本体的语义标注方法研究 22-36 3.1 文档预处理 22-29 3.1.1 文本信息的提取 22-25 3.1.2 文本分词处理 25-28 3.1.3 特征词提取以及本体知识实例的生成 28-29 3.2 基于领域本体的语义标注 29-34 3.2.1 语义标注概述 29 3.2.2 语义标注的三个基本要素 29-31 3.2.3 文档标注的权重 31-34 3.3 语义标注算法 34-35 3.4 语义标注的流程图 35-36 第四章 基于领域本体的查询扩展技术 36-46 4.1 查询扩展的概述 36 4.2 查询扩展的方法 36-38 4.2.1 基于全局分析和局部分析的查询扩展技术 37 4.2.2 基于关联规则的查询扩展技术 37-38 4.2.3 基于用户日志的查询扩展技术 38 4.3 基于领域本体的语义查询扩展 38-43 4.3.1 基于语义的查询扩展 38 4.3.2 基于领域本体的用户查询处理 38-40 4.3.3 基于领域本体的概念关联度的计算 40-43 4.4 检索项推荐 43-44 4.5 Jena推理机 44-46 第五章 基于领域本体的智能信息检索系统的实现 46-56 5.1 系统的开发工具和运行环境 46-48 5.1.1 系统的开发平台 46 5.1.2 开发工具 46-48 5.2 模型框架和功能介绍 48-49 5.3 系统中各关键功能模块的实现 49-54 5.3.1 服装领域本体的构建和完善 49-52 5.3.2 文档语义预处理模块 52-53 5.3.3 查询语义扩展模块 53-54 5.4 实验验证与分析 54-56 第六章 总结与展望 56-58 参考文献 58-61 致谢 61-62 攻读硕士期间发表的论文 62
|
相似论文
- 基于本体的语义检索研究,TP391.3
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 基于SNS的教育视频细粒度标注研究与实现,TP391.6
- 图像语义标注中的块—全局特征提取方法研究,TP391.41
- 人体运动序列数据的语义化分析方法研究,TP391.1
- 结合WordNet的领域语义标注研究,TP391.1
- Deep Web数据抽取及语义标注研究,TP393.09
- 软件安全领域垂直搜索引擎的优化设计与实现,TP391.3
- 基于语义的Web服务匹配研究,TP393.09
- 基于语义的Web服务自动组合的研究,TP393.09
- 基于CPN网络的Deep Web集成系统中结果模式语义标注方法,TP393.09
- 基于分层需求的领域本体构建及语义标注方法研究,TP391.1
- 基于SVM的视频语义提取和相关反馈的研究,TP391.3
- 业务服务的语义描述及标注技术研究,TP311.52
- 一种基于语义标注的个性化搜索技术的研究与实现,TP391.3
- 基于本体的金融事件跟踪,TP391.1
- 基于摄像机网络的监控系统,TP277
- 基于本体的语义搜索技术研究与实现,TP391.3
- 面向Deep Web的数据抽取与语义标注技术研究,TP311.13
- 基于本体管理的高校信息搜索系统研究,G647
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|