学位论文 > 优秀研究生学位论文题录展示
国际专利分类法与中图分类法类目映射研究
作 者: 周林志
导 师: 齐建东
学 校: 北京林业大学
专 业: 计算机应用技术
关键词: 分类法映射 国际专利分类法 中国图书分类法 词汇相似度 交叉检索
分类号: G254
类 型: 硕士论文
年 份: 2010年
下 载: 107次
引 用: 3次
阅 读: 论文下载
内容摘要
信息资源的海量剧增,导致我国科技信息用户在“信息爆炸”的环境中,饱受“知识饥荒”和“找不到真正所需求的和最新的信息和数据”。专利作为一种具有特殊性质的文献,包含了先进的技术方案,但同时存在管理困难、相对孤立、使用率低等弊端。《国际专利分类法》(International Patent Classification,以下简称IPC)是目前国际上最通用的管理和利用专利文献的工具,通过在IPC与《中国图书馆分类法》(Chinese Library Classification,以下简称CLC)的类目之间建立映射从而建立二者的关联,为实现专利和期刊资源交叉浏览和交叉检索提供极大的便利。本文在调研相关领域现有的方法后,采用两种映射方法来实现IPC与CLC之间的类目映射,二者分别基于类目相似度和交叉检索原理。在计算类目相似度的过程中本文为类目定义一个概念模型,同时引入两种词汇相似度计算方法。考虑到用这种方法建立映射过程中受到的人工干预比较大,为了降低人工干预对实验结果的影响,本文设计了另一种基于交叉检索的方法进行映射实验,该方法的实现更多依赖于数学统计而非某种知识组织。最后通过实验证明这两种方法的能够有效地实现分类法间映射。
|
全文目录
摘要 3-4 ABSTRACT 4-7 1 绪论 7-15 1.1 研究背景 7 1.2 研究目的和意义 7-8 1.3 研究内容及方法 8-9 1.4 IPC与CLC的体系结构分析 9-11 1.4.1 编制原则的差异 9-10 1.4.2 体系结构的差异 10 1.4.3 类目描述的差异 10-11 1.5 分类法映射研究现状 11-13 1.5.1 国外分类法映射研究 11-12 1.5.2 国内分类法映射研究 12-13 1.6 论文组织结构 13-15 2 IPC、CLC映射方法研究与实现 15-37 2.1 基于类目相似度实现分类法映射 16-32 2.1.1 基本原理 16-17 2.1.2 类目概念模型的设计 17-18 2.1.3 类目特征词的抽取 18-25 2.1.3.1 现有关键词抽取技术 19-20 2.1.3.2 词库设计 20-21 2.1.3.3 方法概述 21-22 2.1.3.4 最大匹配算法 22-24 2.1.3.5 权重计算 24-25 2.1.4 词汇相似度计算 25-30 2.1.4.1 基于主题词表的相似度计算 25-27 2.1.4.2 基于双序列比对的相似度计算 27-30 2.1.5 类目相似度计算 30-32 2.1.5.1 类目特征词集的相似度 30-31 2.1.5.2 类目所在环境的相似度 31-32 2.2 基于交叉检索实现分类法映射 32-35 2.2.1 基本原理 32-34 2.2.2 实现方法 34-35 2.3 小结 35-37 3 实验验证 37-45 3.1 实验数据 37-38 3.1.1 中文期刊语料库 37-38 3.1.2 专利文献库 38 3.2 关键词抽取实验 38-39 3.3 词汇相似度计算实验 39-41 3.4 映射实验 41-44 3.4.1 基于交叉检索的映射实验 41-43 3.4.2 基于类目相似度的映射实验 43-44 3.5 小结 44-45 4 结论与展望 45-47 4.1 结论 45 4.2 展望 45-47 参考文献 47-49 个人简介 49-50 导师简介 50-51 获得成果目录清单 51-52 致谢 52
|
相似论文
- 基于HTML的Web信息抽取技术的研究与应用,TP393.09
- 面向生物医学领域的跨语言信息检索,TP391.3
- 同声传译源语与译语词汇相似度实证研究,H059
- 基于机器学习的IPC与CLC类目映射方法,TP391.1
- 本体自动生成中词汇相似度计算的研究,TP391.1
- 汉语动词论元约束优选信息的获取,TP391.1
- 面向问答系统的段落检索技术研究,TP391.3
- 汉语动词名物化复合结构的语义解释,TP391.1
- Delicious中文标签与汉语主题词表的结合研究,G254.2
- WordNet和《中国分类主题词表》的映射研究,G254
- 高校图书馆编目业务外包项目管理问题研究,G254.3
- 搜索引擎悖论解读,G254
- 高校图书馆编目工作存在的问题及对策研究,G254.3
- 文献分类学视角中的网络音乐教育资源分类体系,G254.1
- 云南地方文献分类工作规范化问题研究,G254.1
- 基于CNMARC格式的信息资源编目研究,G254.3
- 基于Folksonomy的图书馆信息组织研究,G254.11
- 社会编目网站及其对图书馆的影响研究,G254.3
- 基于本体工具的《中图法》医药学类目的可视化研究,G254.1
- 基于集成词表和对照索引的文献分类法兼容互换研究,G254.1
- 网络信息资源分类组织研究,G254.1
中图分类: > 文化、科学、教育、体育 > 信息与知识传播 > 图书馆学、图书馆事业 > 文献标引与编目
© 2012 www.xueweilunwen.com
|