学位论文 > 优秀研究生学位论文题录展示

图书领域Deep Web查询接口集成研究

作 者: 韩亮
导 师: 袁方
学 校: 河北大学
专 业: 计算机软件与理论
关键词: 接口集成 关键字匹配 本体 语义相似度计算
分类号: TP393.09
类 型: 硕士论文
年 份: 2010年
下 载: 53次
引 用: 0次
阅 读: 论文下载
 

内容摘要


Web上的信息根据深度可以划分为两大类:Deep Web和Surface Web。Deep Web中的信息比Surface Web中的信息质量更高、信息量更大,为了有效地利用这些信息,需要建立Deep Web数据集成系统,而查询接口集成则是Deep Web数据集成的关键步骤。本文主要针对中文图书领域Deep Web数据集成中的查询接口集成进行研究。英文领域的接口集成方法很难有效地应用到中文领域,而中文领域的接口集成方法也存在着集成的属性类型不够全面和匹配准确率较低等一些不足之处。本文针对以上问题对接口集成方法进行了深入研究,首先根据Deep Web接口的结构将查询接口分为4类,然后给出了接口的形式化表示,在此基础上提出了基于关键字、本体和中文语义相似度计算对属性进行匹配的方法。该方法首先对待匹配的属性进行关键字匹配,接着对没有匹配到的属性应用本体进行匹配,然后对于前两个步骤都没有匹配到的属性应用改进的语义相似度计算进行匹配,最后把匹配成功的属性集成在一起构成最终的统一查询接口并进行相应的查询映射。该方法应用于中文图书领域的接口集成,集成的属性较为全面,对结构化、半结构化、无结构化和可转换的混合型查询接口都适用。实验结果表明该方法具有较高的匹配准确率。

全文目录


摘要  5-6
Abstract  6-9
第1章 绪论  9-16
  1.1 研究背景及意义  9-10
  1.2 Deep Web数据集成系统框架  10-12
  1.3 Deep Web数据集成系统研究现状  12-13
  1.4 Deep Web接口集成研究现状  13-14
  1.5 论文内容和结构  14-15
  1.6 本章小结  15-16
第2章 相关知识介绍  16-22
  2.1 HTML  16-18
    2.1.1 HTML概念  16
    2.1.2 HTML标签  16
    2.1.3 HTML表单  16-18
  2.2 XML  18-19
    2.2.1 XML概念和性质  18
    2.2.2 XML文档结构  18-19
  2.3 领域知识  19-20
    2.3.1 领域知识概念  19
    2.3.2 领域知识获取  19-20
  2.4 本体  20-21
    2.4.1 本体概念  20
    2.4.2 本体的种类和应用  20-21
  2.5 本章小结  21-22
第3章 接口分类和表示  22-26
  3.1 接口分类  22-24
  3.2 接口表示  24-25
  3.3 本章小结  25-26
第4章 接口集成  26-39
  4.1 概述  26-27
  4.2 预处理  27-28
  4.3 基于关键字的属性匹配  28-32
    4.3.1 确定关键字  28-30
    4.3.2 基于关键字的属性匹配  30-31
    4.3.3 建立领域知识库  31-32
  4.4 基于本体的属性匹配  32-33
  4.5 基于语义相似度的属性匹配  33-37
    4.5.1 语义相似度计算  34-36
    4.5.2 重复匹配情况处理  36-37
  4.6 接口布局  37
  4.7 接口映射  37-38
  4.8 本章小结  38-39
第5章 实验结果与分析  39-43
  5.1 数据集  39
  5.2 实验结果  39-41
    5.2.1 不加领域本体匹配的实验结果  39-40
    5.2.2 结合基于领域本体匹配的实验结果  40-41
  5.3 实验分析  41-42
  5.4 本章小结  42-43
第6章 总结与展望  43-44
参考文献  44-48
致谢  48-49
攻读学位期间取得的科研成果  49

相似论文

  1. 哲学思想在指导中学数学教学中的作用,G633.6
  2. 基于本体的语义检索研究,TP391.3
  3. 不同人群本体感觉差异性比较及脑机制研究,B845
  4. 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
  5. 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
  6. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  7. WordNet和《中国分类主题词表》的映射研究,G254
  8. 拉图尔的行动者网络理论研究,N02
  9. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  10. 220kV输电线路除冰机器人机械本体研究,TP242
  11. 基于本体的食品投诉文档文本聚类研究,TP391.1
  12. 关系数据库到RDF(S)映射方法的研究,TP311.13
  13. Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
  14. 基于语义的Web服务发现研究,TP393.09
  15. 本体在智能小区中的应用研究,TP391.1
  16. 基于领域本体的海洋环境数据仓库设计,TP311.13
  17. 数据空间中数据资源之间关联关系发现模型研究,TP311.13
  18. 普适计算下智能空间的哲学探究,N02
  19. 企业级软件组件质量保障与快速部团策略的研究,TP311.53
  20. 情景应对模式下数字化应急预案的语义模型研究,TP391.1
  21. 一种基于语义的建筑工程质量检测方法研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com