学位论文 > 优秀研究生学位论文题录展示
基于Lucene的电力企业信息全文搜索系统的设计和实现
作 者: 何霞
导 师: 吴克河
学 校: 华北电力大学(北京)
专 业: 计算机应用技术
关键词: 企业搜索 Lucene 索引 实时更新 DWR框架
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 94次
引 用: 0次
阅 读: 论文下载
内容摘要
电力企业智能管理系统的搜索功能有着很大的局限性,用户在需要搜索定位资源时,通常是利用模块内提供的简单查询功能来实现,这些查询功能是利用SQL语句,对相应的数据库表进行查询的,通用性和实用性都有待提高。因为模块间的独立性,查询的结果也没有特别的可以参考的意义,只是单独查询,简单展示,不能将相关的记录放在一起进行比较。本文实现的基于Lucene的电力企业信息全文搜索系统,解决了这个突出问题,采用全文搜索的策略,为用户提供一个通用的搜索接口,用户只需输入关键字就能搜索到需要的结果。本系统解决的关键问题有:将数据库中的有结构数据转换为无结构的数据,采用Lucene框架对其建立全文索引后为用户提供搜索服务功能;实时监控数据库中记录的变化,实现索引的定时和随时更新。针对电力企业有许多专业术语的特点,提出了一种基于词库的改进分词算法,该分词器经过测试,已取得了很好的分词效果,并应用到该电力企业信息全文搜索系统中。
|
全文目录
摘要 3 ABSTRACT 3-6 第一章 引言 6-10 1.1 课题背景及意义 6 1.2 实现企业信息全文搜索的技术和研究动态 6-9 1.2.1 实现企业信息全文搜索的技术 7 1.2.2 搜索引擎国外研究现状 7-8 1.2.3 搜索引擎国内研究现状 8-9 1.3 本文的主要研究内容与章节安排 9-10 第二章 实现电力企业信息全文搜索系统的技术 10-16 2.1 全文搜索策略 10 2.2 Lucene全文搜索 10-13 2.2.1 Lucene简介 10-11 2.2.2 Lucene的系统结构及功能分析 11-12 2.2.3 Lucene检索原理 12-13 2.3 实现web定时功能技术简介 13-14 2.4 DWR框架 14 2.5 本章小结 14-16 第三章 电力企业信息全文搜索系统的分析 16-23 3.1 应用现状及存在问题 16-17 3.2 传统数据库检索存在的问题 17 3.3 电力企业信息全文搜索系统需求分析 17-21 3.3.1 基于关键字的全文搜索 18 3.3.2 索引的可配置 18 3.3.3 索引定时更新 18 3.3.4 电力企业信息全文搜索系统和电力企业业务系统的关系 18-21 3.4 电力企业信息全文搜索系统的解决方案 21-22 3.5 本章小结 22-23 第四章 电力企业信息全文搜索系统的设计 23-37 4.1 电力企业信息全文搜索系统的总体框架 23-25 4.2 电力企业信息全文搜索系统数据库表及索引库设计 25-27 4.2.1 数据库表设计 25-26 4.2.2 索引库结构设计 26-27 4.3 电力企业信息全文搜索系统详细功能设计 27-32 4.3.1 索引配置程序 27-28 4.3.2 构建适用于电力企业信息全文搜索系统的分词器 28 4.3.3 索引建立策略 28-30 4.3.4 索引更新策略 30-32 4.3.5 搜索服务程序设计 32 4.4 设计适用于电力企业信息全文搜索系统的分词器 32-36 4.4.1 最大长度匹配分词算法 32-33 4.4.2 改进的中文分词算法 33 4.4.3 建立电力企业词库 33-35 4.4.4 算法设计思想 35-36 4.5 本章小结 36-37 第五章 基于Lucene的电力企业信息全文搜索系统的实现 37-55 5.1 实现适用于电力企业信息全文搜索系统的分词器 37-39 5.1.1 Lucene自带分词器的分析 37-38 5.1.2 分词器实现过程 38-39 5.2 实现索引定制模块 39-40 5.3 实现索引建立及维护更新 40-43 5.4 实现搜索服务程序 43-51 5.5 系统测试及分析 51-53 5.5.1 分词器测试 52 5.5.2 电力企业信息全文搜索系统测试 52-53 5.6 本章小结 53-55 总结和展望 55-56 参考文献 56-59 致谢 59-60 在校期间发表论文和参加科研情况 60
|
相似论文
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- 大规模稀疏关系数据索引技术研究,TP311.132.3
- 面向动态文档集的大规模文本索引构建技术的研究,TP391.3
- 面向海量邮件的检索系统研究与实现,TP393.098
- Bicluster数据分析软件设计与实现,TP311.52
- 网络搜索引擎的相关技术研究,G354
- 虹膜识别算法的研究与实现,TP391.41
- 基于SMP的内存数据库查询处理优化研究,TP311.13
- 基于MVC设计模式的网络服务平台的研究与实现,TP311.52
- 数据空间下的索引策略研究,TP311.13
- 低成本RFID系统安全协议研究,TP391.44
- 存储系统中多维元数据索引的高效更新方法研究,TP333
- 基于P2P的空间矢量数据快速索引机制的研究,TP391.3
- 大规模图像检索中局部特征聚合与索引方法研究,TP391.3
- 基于熵的音乐声纹检索算法的研究与实现,TP391.3
- 在线备份系统中存储服务器的研究与实现,TP333
- 分布式搜索引擎索引安全及缓存策略研究,TP333
- 外包数据库模式下中文文档密文检索研究,TP391.3
- 构件垂直搜索引擎的关键技术研究,TP391.3
- 基于量化索引调制的抗共谋指纹技术研究,TP309
- 基于Nutch的企业搜索引擎的研究与实现,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|