学位论文 > 优秀研究生学位论文题录展示

一种新型的信息检索架构:DualEye

作 者: 崔琪
导 师: 宋成
学 校: 北京交通大学
专 业: 软件工程
关键词: DualEye 检索 数据库 全文检索 整合
分类号: TP311.52
类 型: 硕士论文
年 份: 2008年
下 载: 48次
引 用: 1次
阅 读: 论文下载
 

内容摘要


结合软件工程的需求分析,我们分析调研认识到,随着信息的不断增长,用户对检索的需求与日俱增。宏观来看,信息检索的方式在从以数据为中心向以用户为中心转变。早期的数据规模小,结构化强,传统的数据库可以稳定地应对。随着数据规模和种类的增长,结构化查询渐渐不能完全满足人们的需求,检索的低效激发了全文检索的诞生。全文检索的流行是用户需求和数据规模共同推动的。但是,由于历史原因和特殊用途,大量的数据已经被不适当地存储,所以,为了进一步提高检索效率、提高用户体验,产业界期待一种能够无缝检索不同类型信息的检索架构。本文从工程角度出发,给出了一种能够根据用户定制,检索关系型数据库和文档集合的检索架构——DualEye。DualEye有两种检索能力,即基于数据库的结构化查询和基于全文检索引擎的文档内容查询,这两种查询方式可以根据用户的定制配合工作,为不同类型的数据提供了高效的检索方式。DualEve保证了结构化数据的准确检索,而且保证了长文本的快速检索,结合了数据库和全文检索的优点,使其各有所用。另外,DualEye提供了高模块化的接口,可以用作检索的中间层,能够灵活地应用到各种数据查询中并且移植性强,以增强其查询能力和查询范围。这种高内聚、低耦合的特点为DualEye的重用性建立了良好的基础,非常适合企业应用。

全文目录


致谢  5-6
中文摘要  6-7
ABSTRACT  7-8
序  8-11
1 引言  11-12
2 工程背景  12-26
  2.1 信息检索的重要性  12
  2.2 信息检索领域现状  12-18
    2.2.1 数据库检索  12-15
    2.2.2 全文检索  15-16
    2.2.3 增强型数据库  16-17
    2.2.4 现有检索方式的不足  17-18
  2.3 DualEye相关技术  18-26
    2.3.1 Lucene全文检索引擎  18-23
    2.3.2 SQL Server数据库  23-24
    2.3.3 ODBC  24-26
3 DualEye信息检索系统的需求分析  26-30
  3.1 目标问题  26-27
    3.1.1 数据库检索速度问题  26
    3.1.2 全文检索的准确性问题  26-27
  3.2 目标用户  27-28
  3.3 解决方案  28-30
    3.3.1 解决方案简介  28
    3.3.2 文档全文检索方案  28-29
    3.3.3 数据库全文检索方案  29-30
4 DualEye信息检索系统的设计  30-43
  4.1 系统设计创新性  30-31
    4.1.1 信息种类适应型检索  30-31
    4.1.2 低耦合中间层接口  31
    4.1.3 检索结果无缝连接  31
  4.2 系统框架设计  31-37
    4.2.1 系统总体设计  31-32
    4.2.2 信息录入设计  32-35
    4.2.3 信息查询设计  35-36
    4.2.4 用户交互设计  36-37
  4.3 系统详细设计与实现  37-43
    4.3.1 对文件的搜索  37-39
    4.3.2 对数据库检索  39-41
    4.3.3 中文搜索功能增强  41-42
    4.3.4 为数据库搜索建立增量索引  42-43
5 实验与结果分析  43-53
  5.1 模块性能分析  43-47
    5.1.1 结构化数据检索性能分析  43-46
    5.1.2 全文检索性能分析  46-47
  5.2 应用性能分析  47-49
    5.2.1 不含长文本字段的结构化数据案例  47-48
    5.2.2 含长文本字段的结构化数据案例  48
    5.2.3 无摘要信息的全文档数据案例  48
    5.2.4 含摘要信息的文档数据案例  48-49
  5.3 应用实例  49-53
    5.3.1 案例介绍  49
    5.3.2 需求分析与解决方案  49
    5.3.3 操作说明  49-51
    5.3.4 性能对比  51-53
6 总结  53-54
参考文献  54-55
作者简历  55-57
学位论文数据集  57

相似论文

  1. 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
  2. 金源文化影响下的阿城街区建筑改造设计研究,TU984.114
  3. 高中政治新课程改革课堂教学模式整合探索,G633.2
  4. 电子文书安全签发系统的研制,TN918.2
  5. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  6. 海量数据压缩、操作和处理方法的研究,TP311.13
  7. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  8. 基于词义及语义分析的问答技术研究,TP391.1
  9. Q学习在基于内容图像检索技术中的应用,TP391.41
  10. 基于内容的服装图像检索技术研究及实现,TP391.41
  11. 基于多示例学习的用户关注概念区域发现,TP391.41
  12. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  13. 个性化检索中相似用户群的获取与更新,TP391.3
  14. 生物医学领域检索系统查询扩展技术研究,TP391.3
  15. 基于停用词处理的汉语语音检索方法,TP391.1
  16. 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
  17. 面向海量邮件的检索系统研究与实现,TP393.098
  18. 多样性密度学习算法的研究与应用,TP181
  19. 从《道德经》英译看概念整合理论对汉语典籍英译的解释力,H315.9
  20. 武器装备信息管理系统的设计与实现,TP311.52
  21. 部队在线考试系统设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com