学位论文 > 优秀研究生学位论文题录展示

基于Lucene的电力企业信息全文搜索系统的设计和实现

作 者: 何霞
导 师: 吴克河
学 校: 华北电力大学(北京)
专 业: 计算机应用技术
关键词: 企业搜索 Lucene 索引 实时更新 DWR框架
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 94次
引 用: 0次
阅 读: 论文下载
 

内容摘要


电力企业智能管理系统的搜索功能有着很大的局限性,用户在需要搜索定位资源时,通常是利用模块内提供的简单查询功能来实现,这些查询功能是利用SQL语句,对相应的数据库表进行查询的,通用性和实用性都有待提高。因为模块间的独立性,查询的结果也没有特别的可以参考的意义,只是单独查询,简单展示,不能将相关的记录放在一起进行比较。本文实现的基于Lucene的电力企业信息全文搜索系统,解决了这个突出问题,采用全文搜索的策略,为用户提供一个通用的搜索接口,用户只需输入关键字就能搜索到需要的结果。本系统解决的关键问题有:将数据库中的有结构数据转换为无结构的数据,采用Lucene框架对其建立全文索引后为用户提供搜索服务功能;实时监控数据库中记录的变化,实现索引的定时和随时更新。针对电力企业有许多专业术语的特点,提出了一种基于词库的改进分词算法,该分词器经过测试,已取得了很好的分词效果,并应用到该电力企业信息全文搜索系统中。

全文目录


摘要  3
ABSTRACT  3-6
第一章 引言  6-10
  1.1 课题背景及意义  6
  1.2 实现企业信息全文搜索的技术和研究动态  6-9
    1.2.1 实现企业信息全文搜索的技术  7
    1.2.2 搜索引擎国外研究现状  7-8
    1.2.3 搜索引擎国内研究现状  8-9
  1.3 本文的主要研究内容与章节安排  9-10
第二章 实现电力企业信息全文搜索系统的技术  10-16
  2.1 全文搜索策略  10
  2.2 Lucene全文搜索  10-13
    2.2.1 Lucene简介  10-11
    2.2.2 Lucene的系统结构及功能分析  11-12
    2.2.3 Lucene检索原理  12-13
  2.3 实现web定时功能技术简介  13-14
  2.4 DWR框架  14
  2.5 本章小结  14-16
第三章 电力企业信息全文搜索系统的分析  16-23
  3.1 应用现状及存在问题  16-17
  3.2 传统数据库检索存在的问题  17
  3.3 电力企业信息全文搜索系统需求分析  17-21
    3.3.1 基于关键字的全文搜索  18
    3.3.2 索引的可配置  18
    3.3.3 索引定时更新  18
    3.3.4 电力企业信息全文搜索系统和电力企业业务系统的关系  18-21
  3.4 电力企业信息全文搜索系统的解决方案  21-22
  3.5 本章小结  22-23
第四章 电力企业信息全文搜索系统的设计  23-37
  4.1 电力企业信息全文搜索系统的总体框架  23-25
  4.2 电力企业信息全文搜索系统数据库表及索引库设计  25-27
    4.2.1 数据库表设计  25-26
    4.2.2 索引库结构设计  26-27
  4.3 电力企业信息全文搜索系统详细功能设计  27-32
    4.3.1 索引配置程序  27-28
    4.3.2 构建适用于电力企业信息全文搜索系统的分词器  28
    4.3.3 索引建立策略  28-30
    4.3.4 索引更新策略  30-32
    4.3.5 搜索服务程序设计  32
  4.4 设计适用于电力企业信息全文搜索系统的分词器  32-36
    4.4.1 最大长度匹配分词算法  32-33
    4.4.2 改进的中文分词算法  33
    4.4.3 建立电力企业词库  33-35
    4.4.4 算法设计思想  35-36
  4.5 本章小结  36-37
第五章 基于Lucene的电力企业信息全文搜索系统的实现  37-55
  5.1 实现适用于电力企业信息全文搜索系统的分词器  37-39
    5.1.1 Lucene自带分词器的分析  37-38
    5.1.2 分词器实现过程  38-39
  5.2 实现索引定制模块  39-40
  5.3 实现索引建立及维护更新  40-43
  5.4 实现搜索服务程序  43-51
  5.5 系统测试及分析  51-53
    5.5.1 分词器测试  52
    5.5.2 电力企业信息全文搜索系统测试  52-53
  5.6 本章小结  53-55
总结和展望  55-56
参考文献  56-59
致谢  59-60
在校期间发表论文和参加科研情况  60

相似论文

  1. 支持XML数据查询的F&B索引结构的研究,TP311.13
  2. 大规模稀疏关系数据索引技术研究,TP311.132.3
  3. 面向动态文档集的大规模文本索引构建技术的研究,TP391.3
  4. 面向海量邮件的检索系统研究与实现,TP393.098
  5. Bicluster数据分析软件设计与实现,TP311.52
  6. 网络搜索引擎的相关技术研究,G354
  7. 虹膜识别算法的研究与实现,TP391.41
  8. 基于SMP的内存数据库查询处理优化研究,TP311.13
  9. 基于MVC设计模式的网络服务平台的研究与实现,TP311.52
  10. 数据空间下的索引策略研究,TP311.13
  11. 低成本RFID系统安全协议研究,TP391.44
  12. 存储系统中多维元数据索引的高效更新方法研究,TP333
  13. 基于P2P的空间矢量数据快速索引机制的研究,TP391.3
  14. 大规模图像检索中局部特征聚合与索引方法研究,TP391.3
  15. 基于熵的音乐声纹检索算法的研究与实现,TP391.3
  16. 在线备份系统中存储服务器的研究与实现,TP333
  17. 分布式搜索引擎索引安全及缓存策略研究,TP333
  18. 外包数据库模式下中文文档密文检索研究,TP391.3
  19. 构件垂直搜索引擎的关键技术研究,TP391.3
  20. 基于量化索引调制的抗共谋指纹技术研究,TP309
  21. 基于Nutch的企业搜索引擎的研究与实现,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com