学位论文 > 优秀研究生学位论文题录展示

国际专利分类法与中图分类法类目映射研究

作 者: 周林志
导 师: 齐建东
学 校: 北京林业大学
专 业: 计算机应用技术
关键词: 分类法映射 国际专利分类法 中国图书分类法 词汇相似度 交叉检索
分类号: G254
类 型: 硕士论文
年 份: 2010年
下 载: 107次
引 用: 3次
阅 读: 论文下载
 

内容摘要


信息资源的海量剧增,导致我国科技信息用户在“信息爆炸”的环境中,饱受“知识饥荒”和“找不到真正所需求的和最新的信息和数据”。专利作为一种具有特殊性质的文献,包含了先进的技术方案,但同时存在管理困难、相对孤立、使用率低等弊端。《国际专利分类法》(International Patent Classification,以下简称IPC)是目前国际上最通用的管理和利用专利文献的工具,通过在IPC与《中国图书馆分类法》(Chinese Library Classification,以下简称CLC)的类目之间建立映射从而建立二者的关联,为实现专利和期刊资源交叉浏览和交叉检索提供极大的便利。本文在调研相关领域现有的方法后,采用两种映射方法来实现IPC与CLC之间的类目映射,二者分别基于类目相似度和交叉检索原理。在计算类目相似度的过程中本文为类目定义一个概念模型,同时引入两种词汇相似度计算方法。考虑到用这种方法建立映射过程中受到的人工干预比较大,为了降低人工干预对实验结果的影响,本文设计了另一种基于交叉检索的方法进行映射实验,该方法的实现更多依赖于数学统计而非某种知识组织。最后通过实验证明这两种方法的能够有效地实现分类法间映射。

全文目录


摘要  3-4
ABSTRACT  4-7
1 绪论  7-15
  1.1 研究背景  7
  1.2 研究目的和意义  7-8
  1.3 研究内容及方法  8-9
  1.4 IPC与CLC的体系结构分析  9-11
    1.4.1 编制原则的差异  9-10
    1.4.2 体系结构的差异  10
    1.4.3 类目描述的差异  10-11
  1.5 分类法映射研究现状  11-13
    1.5.1 国外分类法映射研究  11-12
    1.5.2 国内分类法映射研究  12-13
  1.6 论文组织结构  13-15
2 IPC、CLC映射方法研究与实现  15-37
  2.1 基于类目相似度实现分类法映射  16-32
    2.1.1 基本原理  16-17
    2.1.2 类目概念模型的设计  17-18
    2.1.3 类目特征词的抽取  18-25
      2.1.3.1 现有关键词抽取技术  19-20
      2.1.3.2 词库设计  20-21
      2.1.3.3 方法概述  21-22
      2.1.3.4 最大匹配算法  22-24
      2.1.3.5 权重计算  24-25
    2.1.4 词汇相似度计算  25-30
      2.1.4.1 基于主题词表的相似度计算  25-27
      2.1.4.2 基于双序列比对的相似度计算  27-30
    2.1.5 类目相似度计算  30-32
      2.1.5.1 类目特征词集的相似度  30-31
      2.1.5.2 类目所在环境的相似度  31-32
  2.2 基于交叉检索实现分类法映射  32-35
    2.2.1 基本原理  32-34
    2.2.2 实现方法  34-35
  2.3 小结  35-37
3 实验验证  37-45
  3.1 实验数据  37-38
    3.1.1 中文期刊语料库  37-38
    3.1.2 专利文献库  38
  3.2 关键词抽取实验  38-39
  3.3 词汇相似度计算实验  39-41
  3.4 映射实验  41-44
    3.4.1 基于交叉检索的映射实验  41-43
    3.4.2 基于类目相似度的映射实验  43-44
  3.5 小结  44-45
4 结论与展望  45-47
  4.1 结论  45
  4.2 展望  45-47
参考文献  47-49
个人简介  49-50
导师简介  50-51
获得成果目录清单  51-52
致谢  52

相似论文

  1. 基于HTML的Web信息抽取技术的研究与应用,TP393.09
  2. 面向生物医学领域的跨语言信息检索,TP391.3
  3. 同声传译源语与译语词汇相似度实证研究,H059
  4. 基于机器学习的IPC与CLC类目映射方法,TP391.1
  5. 本体自动生成中词汇相似度计算的研究,TP391.1
  6. 汉语动词论元约束优选信息的获取,TP391.1
  7. 面向问答系统的段落检索技术研究,TP391.3
  8. 汉语动词名物化复合结构的语义解释,TP391.1
  9. Delicious中文标签与汉语主题词表的结合研究,G254.2
  10. WordNet和《中国分类主题词表》的映射研究,G254
  11. 高校图书馆编目业务外包项目管理问题研究,G254.3
  12. 搜索引擎悖论解读,G254
  13. 高校图书馆编目工作存在的问题及对策研究,G254.3
  14. 文献分类学视角中的网络音乐教育资源分类体系,G254.1
  15. 云南地方文献分类工作规范化问题研究,G254.1
  16. 基于CNMARC格式的信息资源编目研究,G254.3
  17. 基于Folksonomy的图书馆信息组织研究,G254.11
  18. 社会编目网站及其对图书馆的影响研究,G254.3
  19. 基于本体工具的《中图法》医药学类目的可视化研究,G254.1
  20. 基于集成词表和对照索引的文献分类法兼容互换研究,G254.1
  21. 网络信息资源分类组织研究,G254.1

中图分类: > 文化、科学、教育、体育 > 信息与知识传播 > 图书馆学、图书馆事业 > 文献标引与编目
© 2012 www.xueweilunwen.com