学位论文 > 优秀研究生学位论文题录展示
专利信息检索系统的研究与实现
作 者: 刘卫秋
导 师: 谭汉松
学 校: 中南大学
专 业: 计算机技术
关键词: 专利检索 术语抽取 词典库 专利分析
分类号: TP391.3
类 型: 硕士论文
年 份: 2010年
下 载: 65次
引 用: 0次
阅 读: 论文下载
内容摘要
专利信息在当前社会是首选的竞争情报资源,它蕴含着巨大的知识存量。充分挖掘和利用专利信息有助于技术人员改进现有技术,发现新的技术领域。然而当前专利数量急剧增长,依靠人工手段寻找有用专利信息,并进行快速有效的专利分析,几乎是不可能的。专利信息检索系统就是为了帮助大家在众多的专利资源中找到自己需要的资源。专利信息检索的精确度和准全率和索引文件所依赖的词典库有着直接而重要的关系。如果词典库能包含专利信息中所有的词汇,那专利检索的精确度和准全率一定很高。本文中我们将介绍一种术语抽取技术,用哈工大计算机学院智能技术与自然语言处理研究室的词典文件作为一般词典库,从专利原始资料中抽取出专业术语,形成术语词典库。一般词典库和术语词典库共同作为生成索引文件的词典库。考虑到专利的原始文本信息量非常之大,在生成术语词典库的过程中,几个比较关键的算法:后缀数组、取重复串和互信息,采用了C语言作为算法的开发语言,C语言的算法可以做到比较高的速度读取文本,并且支持大文件的操作;而在专利检索业务,我们采用B/S的架构,采用Java语言作为上层业务的开发语言。在术语词典库的生成过程中。最后,设计实现了专利的检索系统以及简单的分析功能,以“诺基亚手机”为关键词,给出来专利检索和专利分析的实例。
|
全文目录
相似论文
- 特定领域中文术语抽取,TP391.1
- 面向专利领域的中文文本分类与检索方法研究,TP391.1
- 领域概念自动抽取研究,TP391.1
- 我国实用新型法律保护制度探讨,D923.42
- 基于专利分析的竞争对手分类系统研究,G306
- 中国高校专利产出状况对比分析,G306
- 专利等级划分方法的研究与实现,G306
- Lucene全文检索技术在专利服务平台中的研究与应用,TP391.3
- 基于数据挖掘的专利情报趋势应用研究,G306
- 基于日志挖掘的查询词推荐研究与实现,TP391.3
- CH公司数字电视专利管理策略研究,F416.6
- 图像检索方法研究,TP391.41
- 实体关系自动抽取技术的比较研究,TP391.1
- 我国电动汽车产业的专利分析与发展对策研究,G353.1
- 国内外三大专利检索系统比较研究,G354.4
- 基于本体和分词技术的非结构化工艺知识管理系统,TP391.1
- 基于专利文献的企业间技术态势研究,F273.1
- 基于专利的技术发展趋势研究,G306
- 基于专利引用的企业技术影响力及其创新战略分析,F224
- 专利运用策略研究,F426.4;D923.42
- 基于BI的专利数据整合分析研究及实现,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|