学位论文 > 优秀研究生学位论文题录展示

基于用户模型的个性化元搜索引擎的研究与设计

作 者: 胡维慧
导 师: 路燕
学 校: 山东科技大学
专 业: 计算机软件与理论
关键词: 信息检索 元搜索引擎 个性化服务 用户模型 结果整合
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 75次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着Internet技术的飞速发展以及Web信息的膨胀增长,人们在网络信息的海洋里,检索到自己想要的信息变得越来越不容易。搜索引擎技术,解决了人们的这一“迷航”问题,从而在信息检索领域中扮演着越来越重要的角色。元搜索引擎的出现,弥补了通用搜索引擎的数据库覆盖率低,检索质量低,冗余度大,本身数据库维护更新困难等局限性,在信息的查全率和查准率上得到了大幅改善,特别是与体现用户偏好的个性化检索服务进行结合,使得查找的信息具有了更好的针对性,从而成为时下研究的重要课题。本文主要对体现个性化检索服务的用户兴趣模型和对基于用户模型的元搜索引擎结果整合算法进行了分析和研究。本文从用户的搜索行为着手,考虑用户的搜索行为对用户兴趣的映射,以及对搜索结果整合的影响,从而构建基于用户搜索行为的模型。并在此基础上,提出了改进的基于用户模型的元搜索引擎结果整合算法,给出了基于算法的公式计算方法和参量设置。同时,本文搭建了一个基于用户模型的简易元搜索引擎系统,为保证界面的友好性和用户操作的方便性,系统采用当前流行的Google、百度、雅虎、搜狗四个独立搜索引擎作为成员搜索引擎。在系统的搭建过程中,本文对系统所采用的成员引擎的查询分发机制、成员引擎的调度算法的选取均进行了详细的分析和讨论,并对成员引擎返回结果页的信息抽取技术和用户模型的异步刷新技术做了深入分析和说明。最后,通过实验结果的分析和比较,验证了基于个性化需求的用户模型对于元搜索引擎返回结果排名的有效影响。

全文目录


摘要  5-6
ABSTRACT  6-11
1 绪论  11-18
  1.1 本文的研究背景  11-12
  1.2 元搜索技术的研究现状和研究意义  12-16
  1.3 本文的工作内容  16
  1.4 论文的组织结构  16-18
2 元搜索引擎概述  18-25
  2.1 元搜索引擎的工作原理  18-20
  2.2 元搜索引擎的类型划分  20-21
  2.3 元搜索引擎的相对优势  21-22
  2.4 元搜索引擎的评价指标  22-23
  2.5 个性化检索服务的发展现状  23-24
  2.6 小结  24-25
3 用户模型研究及其构建  25-34
  3.1 用户模型概述  25-26
  3.2 基于用户模型的学习方法  26-27
  3.3 用户模型的构建方式  27-30
  3.4 基于用户搜索行为的模型构建  30-33
  3.5 小结  33-34
4 元搜索引擎结果合并算法的研究及改进  34-43
  4.1 成员引擎返回结果的合并过程  34-35
  4.2 元搜索引擎的结果整合算法  35-37
  4.3 基于用户模型的结果整合算法  37-42
  4.4 小结  42-43
5 基于用户模型的元搜索引擎系统的设计与实现  43-60
  5.1 基于用户模型的元搜索引擎系统架构  43-46
  5.2 成员引擎调度算法的选取  46-49
  5.3 查询分发机制的制定  49-52
  5.4 搜索结果页面信息的抽取  52-54
  5.5 AjaX异步刷新技术的使用  54-56
  5.6 实验结果的分析及比较  56-59
  5.7 小结  59-60
6 总结与展望  60-63
  6.1 工作总结  60-61
  6.2 未来展望  61-63
致谢  63-64
参考文献  64-67
攻读硕士学位期间发表的论文  67

相似论文

  1. 生物医学领域检索系统查询扩展技术研究,TP391.3
  2. 面向海量邮件的检索系统研究与实现,TP393.098
  3. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  4. 基于自然遗忘的个性化推荐算法研究,TP311.52
  5. 基于Web挖掘技术研究及其在数字图书馆中的应用,G250.76
  6. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  7. 基于稀疏非负矩阵分解的图像检索,TP391.41
  8. 跨语言文本分类的研究,TP391.1
  9. 高校图书馆管理系统的个性化服务的设计与实现,TP311.52
  10. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  11. 排序学习损失函数的研究,TP181
  12. 基于角色任务的个性化资源服务推送机制研究,TP311.52
  13. 基于Agent元搜索引擎的个性化研究,TP391.3
  14. 基于点击的用户聚类的研究,TP311.13
  15. 英汉跨语言问答系统中的文档语义检索,TP391.1
  16. 四川职业技术学院校务门户网站的改进与实现,TP393.092
  17. 基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
  18. 基于Web的医学文献数据库的设计与实现,TP311.13
  19. 基于语义Web的信息检索技术研究,TP391.3
  20. 基于OWL的地名本体构建与检索机制研究,P208
  21. 面向地名本体服务的空间信息检索研究,P208

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com