学位论文 > 优秀研究生学位论文题录展示
基于本体的数字图书馆语义互操作
作 者: 刘炜
导 师: 施伯乐
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 数字图书馆 体系结构 语义互操作 本体 语义Web 语义模型 OAI OpenURL 元数据 标准规范
分类号: G250.76
类 型: 博士论文
年 份: 2006年
下 载: 1648次
引 用: 8次
阅 读: 论文下载
内容摘要
数字图书馆是一个没有明确边界的研究领域,关注的是对一个有组织(或称为有序)的信息体的构造,不论这个信息体是分布的还是集中的、虚拟的还是实在的,以满足特定的信息需求,不论这个需求来自真实的用户还是机器代理。数字化和网络化,特别是近20年来互联网的指数级发展带来了严重的信息超载(Information Overload)。为了更好地组织信息,满足人们的信息需求,数字图书馆应运而生,然而要从根本上提高数字图书馆对大规模分布式信息的处理能力,准确而全面地提供信息服务,有赖于机器对网络信息的自动处理和“理解”能力。因此实现语义信息的组织和检索,是一个很有前途的突破口。 “语义”指“信息的含义”,“互操作性”是不同平台或编程语言之间交换和共享数据的能力。解决异构信息环境中信息系统之间的高层互操作问题是数字图书馆的一项重要研究内容,而语义互操作是其中的重点和核心问题。这并不是说目前的互操作解决方案中没有考虑语义互操作,而是没有把语义互操作当作独立的目标来考虑。本论文提出对于数字图书馆须定义和设计一个独立的语义互操作层,使数字图书馆所包含的信息资源获得语义的“显性”化,而不是隐式地、内含地包含在语法和具体的系统实现中。 本文研究的内容主要包括两个方面:针对数字图书馆的体系结构和互操作需求特点,将本体论作为语义描述和实现语义共享和互操作的基础,提出了一种以规范的元数据表述和本体服务架构的表示模型和数字图书馆语义的结构化、形式化方法,并研究了相关策略和理论;同时针对数字图书馆资源集成和服务集成的特点和需求,以及现有各类互操作协议,提出了一种基于SOA的语义Web服务架构,并根据该模型架构提出了一套具体操作方法和策略。本文以集成模型为基础,以面向对象模型进行数字图书馆的语义表示,以元数据和本体作为共享的基础,将资源的组织、结构与服务模型有机结合起来,本文的主要特点如下: ● 在总结数字图书馆互操作现有技术和模型的基础上,提出了基本的语义互操作需求,研究并设计了一套数字图书馆语义结构模型,并总结了其表示和实现形式,为数字图书馆语义的提取和形式化表示提供了框架。 ● 提出规范的数字图书馆语义化方法,包括规范的元数据方法和本体模型的建立方法;采用结构化、层次化方法对数字图书馆语义信息进行组织和存储。所提出的资源集合(站点)元数据方案正在申报作为科技部标准。 ● 对于应用Web服务实现基于本体的语义互操作服务,包括语义模型的动态映射、转换和服务合成,提出了一套实施架构,并提出两种具体的操作方法可以应用于建立数字图书馆语义架构:自底向上法和自顶向下方法,前者通过各类语义规范的实施应用于建设全新的具有语义互操作层的数字图书馆,后者通过语义抽取、标注等方法应用于对目前提供网络服务的各类资源集合和数字图书馆进行资源集成和服务集成。 ● 在一个应用实例——名人手稿数字图书馆的体系设计和系统开发中建立了基于本体的语义互操作原型,实现了规范的语义描述架构和基本的与其它数字图书馆和资源库的语义互操作。 本文的研究从对数字图书馆宏观结构模型和微观数字对象模型的探讨出发,以形式化、外显化的元数据和知识本体为要素构建数字图书馆语义架构,作为实现数字图书馆语义互操作的基础。在大量调研现有理论模型和方法论的基础上,将资源的组织、结构与服务模型有机结合起来,对数字图书馆的结构模型在语义表示方面进行了许多扩展,对元数据资源及资源集合描述术语体系、元数据和本体的形式化表示、基于Web服务的数字图书馆语义服务的架构等方面提出了一套较为完整的方案。对于数字图书馆系统的创建或信息与服务集成,本文所研究的理论和技术提供了一个具有普遍意义框架模型,并为深入研究,完善各类基于语义的自动服务提供了一个可行的起点。
|
全文目录
图表索引 7-10 摘要 10-12 ABSTRACT 12-14 第1章 绪论 14-24 1.1 数字图书馆语义互操作问题的提出 14-15 1.2 研究目标和主要问题 15-17 1.3 研究现状 17-20 1.3.1 早期数据库领域的语义互操作研究 18-19 1.3.2 数字图书馆领域互操作方面的研究 19-20 1.4 主要特点和创新之处 20-21 1.5 章节安排与图示 21-24 第2章 数字图书馆互操作 24-58 2.1 引言 24-28 2.1.1 数字图书馆概念 24-25 2.1.2 信息系统的互操作问题 25-27 2.1.3 数字图书馆互操作问题的解决途径 27-28 2.2 数字图书馆体系架构 28-45 2.2.1 K-W结构 29-32 2.2.2 Warwick框架 32-33 2.2.3 Infobus互操作体系模型 33-36 2.2.4 Dienst体系模型 36-39 2.2.5 FEDORA体系结构模型 39-40 2.2.6 5S数字图书馆形式化模型 40-45 2.3 数字图书馆互操作协议 45-56 2.3.1 互操作的三种类型 45-47 2.3.2 Z39.50协议 47-48 2.3.3 ZING:Z39.50在Web时代的发展 48-50 2.3.4 STARTS:因特网检索查询斯坦福协定 50-51 2.3.5 SDLIP:简单数字图书馆互操作协议 51-52 2.3.6 SDARTS:SDLIP+STARTS 52-53 2.3.7 OAI(Open Archives Initiative)框架 53-55 2.3.8 OpenURL开放式链接 55-56 2.4 数字图书馆的语义互操作 56-57 2.5 小结 57-58 第3章 语义和语义模型 58-79 3.1 语义研究 58-65 3.1.1 信息语义的相关研究 58-60 3.1.2 语义的含义 60-61 3.1.3 语义的表达 61-63 3.1.4 数字图书馆的语义研究 63-65 3.2 数字图书馆语义模型 65-72 3.3 语义互操作 72-79 3.3.1 语义编码语言 74-76 3.3.2 W3C编码语言阶梯图 76-79 第4章 数字图书馆语义描述 79-124 4.1 元数据和本体概述 79-80 4.2 DC元数据 80-86 4.3 元数据语义描述存在的问题 86-88 4.4 基本语义元数据描述规范 88-96 4.4.1 元数据规范制定原则 88-90 4.4.2 核心元数据的扩展 90-92 4.4.3 元数据应用纲要(Metadata Application Profile) 92-95 4.4.4 著录规则的制订 95-96 4.5 数字图书馆的本体描述 96-124 4.5.1 本体的概念 96-99 4.5.2 基于本体的信息表示 99-100 4.5.3 本体的作用 100-104 4.5.4 本体表示与元数据的关系 104-105 4.5.5 本体描述的要求 105 4.5.6 本体工具和本体的创建 105-113 4.5.7 应用本体的问题 113-114 4.5.8 叙词表(主题词表)与本体 114-116 4.5.9 叙词转换成本体的案例分析 116-117 4.5.10 转换实例 117-124 第5章 语义互操作模型与架构 124-162 5.1 数字图书馆语义互操作空间 124-127 5.2 元数据的语义描述和形式化 127-139 5.2.1 语义描述声明形式:应用纲要 127-128 5.2.2 语义描述的抽象模型 128-132 5.2.3 记录和描述 132-133 5.2.4 值 133 5.2.5 向上兼容原则 133-134 5.2.6 编码指南 134-135 5.2.7 元数据编码实例 135-139 5.3 本体对于数字图书馆语义描述的作用 139-143 5.4 基于本体的语义互操作的实现 143-155 5.4.1 两类语义互操作方法 143-144 5.4.2 非描述性语义互操作的解决方法 144-146 5.4.3 关于面向服务架构(Service Oriented Architecture) 146-147 5.4.4 面向服务架构(SOA)与Web服务 147-148 5.4.5 元数据服务(Metadata Web Service)的实现 148-151 5.4.6 语义架构应用Web服务的优缺点 151-152 5.4.7 元数据登记系统和元数据服务 152-153 5.4.8 语义冲突的类型 153-154 5.4.9 本体的映射 154-155 5.5 基于本体的元数据服务体系架构 155-160 5.5.1 联邦检索模型 156-157 5.5.2 元数据收割模型 157-158 5.5.3 混合模型 158-160 5.6 小结 160-162 第6章 实例:名人手稿数字图书馆语义架构及其实现 162-186 6.1 概述 162-163 6.2 总体考虑 163-165 6.3 设计原则 165-166 6.4 资源特点 166-170 6.5 元数据方案 170-183 6.5.1 方案的性质 170-171 6.5.2 方案的组成 171-172 6.5.3 属性元素集——核心集及基本扩展 172-176 6.5.4 编码方案 176-177 6.5.5 著录规则 177 6.5.6 规范档 177-178 6.5.7 编码体系 178-181 6.5.8 名人手稿馆元数据著录系统 181-183 6.6 存在的问题和未来发展 183-186 附录A:资源站点(集合)元数据描述规范 186-214 A.1 资源集合描述的作用和意义 187-189 A.2 资源集合描述标准规范的现状 189-192 A.2.1 早期的信息资源集合描述方案 190-191 A.2.2 主流的信息资源集合描述元数据方案 191 A.2.3 用于电子商务的资源集合描述元数据方案 191-192 A.2.4 国内的情况 192 A.3 几种有影响的资源集合描述元数据 192-198 A.3.1 RSLP 193-194 A.3.2 DC CD AP 194-195 A.3.3 RSS(RDF/RICHSITESUMMARY)站点概要 195-196 A.3.4 EAD(ENCODING ARCHIVES DESCRIPTION) 196-197 A.3.5 Z39.50 PROFILE FOR ACCESS TO DIGITAL COLLECTIONS 197-198 A.4 资源集合应用参考模型 198-202 A.5 资源集合描述规范体系 202-208 A.5.1 属性元素集(词表)定义 203-205 A.5.2 编码规范推荐 205-206 A.5.3 规范的维护、应用和扩展机制 206-207 A.5.4 著录规则 207-208 A.6 资源集合描述规范应用实例IESR 208-214 A.6.1 简介 208-209 A.6.2 IESR的数据模型 209-210 A.6.3 IESR的元数据方案 210-212 A.6.4 资源集合描述元数据展望 212-214 附录B 术语定义 214-216 参考文献 216-225 攻读博士学位期间发表的论文 225-226 攻读博士学位期间参与的主要科研项目 226-227 致谢 227-228
|
相似论文
- 面向SMDA的服务建模方法及工具实现,TP311.52
- 基于WEB的仿真互操作性测试工具研究,TP391.9
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于元数据的农田信息存储、管理和共享研究,S126
- 面向业务过程的服务动态组合方法研究,TP393.09
- 基于本体的语义检索研究,TP391.3
- 分面元数据在网站检索系统中的应用研究,G354.2
- 软件可信性增长测试用例生成方法的研究,TP311.53
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 面向高校重点课程的教参资源库建设的应用研究,G642.3
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- C/S模式MIS软件可复用构件的研究与开发,TP311.52
- 数字图书馆信息服务视域下的著作权问题研究,D923.41
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于云计算的数字图书馆服务模式研究,G250.76
- 矿区多源遥感影像集成管理系统的设计与实现,P208
中图分类: > 文化、科学、教育、体育 > 信息与知识传播 > 图书馆学、图书馆事业 > 图书馆学 > 图书馆自动化、网络化 > 电子图书馆、数字图书馆
© 2012 www.xueweilunwen.com
|