学位论文 > 优秀研究生学位论文题录展示
一种新型的信息检索架构:DualEye
作 者: 崔琪
导 师: 宋成
学 校: 北京交通大学
专 业: 软件工程
关键词: DualEye 检索 数据库 全文检索 整合
分类号: TP311.52
类 型: 硕士论文
年 份: 2008年
下 载: 48次
引 用: 1次
阅 读: 论文下载
内容摘要
结合软件工程的需求分析,我们分析调研认识到,随着信息的不断增长,用户对检索的需求与日俱增。宏观来看,信息检索的方式在从以数据为中心向以用户为中心转变。早期的数据规模小,结构化强,传统的数据库可以稳定地应对。随着数据规模和种类的增长,结构化查询渐渐不能完全满足人们的需求,检索的低效激发了全文检索的诞生。全文检索的流行是用户需求和数据规模共同推动的。但是,由于历史原因和特殊用途,大量的数据已经被不适当地存储,所以,为了进一步提高检索效率、提高用户体验,产业界期待一种能够无缝检索不同类型信息的检索架构。本文从工程角度出发,给出了一种能够根据用户定制,检索关系型数据库和文档集合的检索架构——DualEye。DualEye有两种检索能力,即基于数据库的结构化查询和基于全文检索引擎的文档内容查询,这两种查询方式可以根据用户的定制配合工作,为不同类型的数据提供了高效的检索方式。DualEve保证了结构化数据的准确检索,而且保证了长文本的快速检索,结合了数据库和全文检索的优点,使其各有所用。另外,DualEye提供了高模块化的接口,可以用作检索的中间层,能够灵活地应用到各种数据查询中并且移植性强,以增强其查询能力和查询范围。这种高内聚、低耦合的特点为DualEye的重用性建立了良好的基础,非常适合企业应用。
|
全文目录
致谢 5-6 中文摘要 6-7 ABSTRACT 7-8 序 8-11 1 引言 11-12 2 工程背景 12-26 2.1 信息检索的重要性 12 2.2 信息检索领域现状 12-18 2.2.1 数据库检索 12-15 2.2.2 全文检索 15-16 2.2.3 增强型数据库 16-17 2.2.4 现有检索方式的不足 17-18 2.3 DualEye相关技术 18-26 2.3.1 Lucene全文检索引擎 18-23 2.3.2 SQL Server数据库 23-24 2.3.3 ODBC 24-26 3 DualEye信息检索系统的需求分析 26-30 3.1 目标问题 26-27 3.1.1 数据库检索速度问题 26 3.1.2 全文检索的准确性问题 26-27 3.2 目标用户 27-28 3.3 解决方案 28-30 3.3.1 解决方案简介 28 3.3.2 文档全文检索方案 28-29 3.3.3 数据库全文检索方案 29-30 4 DualEye信息检索系统的设计 30-43 4.1 系统设计创新性 30-31 4.1.1 信息种类适应型检索 30-31 4.1.2 低耦合中间层接口 31 4.1.3 检索结果无缝连接 31 4.2 系统框架设计 31-37 4.2.1 系统总体设计 31-32 4.2.2 信息录入设计 32-35 4.2.3 信息查询设计 35-36 4.2.4 用户交互设计 36-37 4.3 系统详细设计与实现 37-43 4.3.1 对文件的搜索 37-39 4.3.2 对数据库检索 39-41 4.3.3 中文搜索功能增强 41-42 4.3.4 为数据库搜索建立增量索引 42-43 5 实验与结果分析 43-53 5.1 模块性能分析 43-47 5.1.1 结构化数据检索性能分析 43-46 5.1.2 全文检索性能分析 46-47 5.2 应用性能分析 47-49 5.2.1 不含长文本字段的结构化数据案例 47-48 5.2.2 含长文本字段的结构化数据案例 48 5.2.3 无摘要信息的全文档数据案例 48 5.2.4 含摘要信息的文档数据案例 48-49 5.3 应用实例 49-53 5.3.1 案例介绍 49 5.3.2 需求分析与解决方案 49 5.3.3 操作说明 49-51 5.3.4 性能对比 51-53 6 总结 53-54 参考文献 54-55 作者简历 55-57 学位论文数据集 57
|
相似论文
- 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
- 金源文化影响下的阿城街区建筑改造设计研究,TU984.114
- 高中政治新课程改革课堂教学模式整合探索,G633.2
- 电子文书安全签发系统的研制,TN918.2
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 海量数据压缩、操作和处理方法的研究,TP311.13
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 基于词义及语义分析的问答技术研究,TP391.1
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 基于内容的服装图像检索技术研究及实现,TP391.41
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 个性化检索中相似用户群的获取与更新,TP391.3
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 基于停用词处理的汉语语音检索方法,TP391.1
- 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
- 面向海量邮件的检索系统研究与实现,TP393.098
- 多样性密度学习算法的研究与应用,TP181
- 从《道德经》英译看概念整合理论对汉语典籍英译的解释力,H315.9
- 武器装备信息管理系统的设计与实现,TP311.52
- 部队在线考试系统设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|