学位论文 > 优秀研究生学位论文题录展示

信息检索中个性化元搜索结果合成的研究

作 者: 赵红维
导 师: 丁振国
学 校: 西安电子科技大学
专 业: 计算机系统结构
关键词: 信息检索 元搜索 摘要法 用户兴趣 搜索结果合成
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 79次
引 用: 4次
阅 读: 论文下载
 

内容摘要


如何在Internet海量信息中快速找到用户感兴趣的信息成为困扰人们的主要问题。元搜索引擎虽然提高了查全率,但仍没能很好的解决查准率问题,本文提出了一种改进的基于用户兴趣的元搜索结果合成算法。论文首先研究了信息检索技术及元搜索引擎技术,探讨了元搜索结果合成中涉及到的关键技术;然后研究了用户兴趣模型,提出用户查询向用户兴趣类的映射算法;接着提出本文的研究重点——基于用户兴趣的元搜索结果合成算法,该算法在改进的摘要/位置法计算用户查询与查询结果相关度的基础上引入了词项和用户兴趣,实现了元搜索引擎的个性化;最后实现了个性化的信息检索原型,基于用户兴趣的结果合成算法应用于其中,对算法进行了实验分析,分别与单个搜索引擎以及其他几种传统结果合并算法比较,表明此算法保证了搜索结果的查全率的同时提高了查准率,从而改善了用户检索效果和效率,满足了用户检索的个性化需求。

全文目录


摘要  3-4
Abstract  4-7
第一章 绪论  7-15
  1.1 课题背景  7-8
  1.2 元搜索引擎现状分析  8-11
  1.3 研究意义  11-12
  1.4 论文内容和结构  12-13
  1.5 本章小结  13-15
第二章 信息检索与元搜索引擎  15-29
  2.1 信息检索技术与理论基础  15-22
    2.1.1 信息检索的概念  15
    2.1.2 信息检索的过程及组成  15-16
    2.1.3 经典信息检索模型  16-18
    2.1.4 信息检索算法  18-22
  2.2 元搜索引擎  22-27
    2.2.1 元搜索引擎的构成  23
    2.2.2 元搜索引擎的分类  23-25
    2.2.3 元搜索引擎的优势  25-26
    2.2.4 元搜索引擎的局限性  26
    2.2.5 元搜索引擎的评价目标  26-27
  2.3 本章小结  27-29
第三章 元搜索结果合成的关键技术  29-37
  3.1 文本选择算法  29-32
    3.1.1 用户指定算法  29
    3.1.2 权值分配算法  29-30
    3.1.3 基于学习的算法  30-31
    3.1.4 保证返回有效文本的算法  31-32
  3.2 结果合并算法  32-34
    3.2.1 局部相似度调整算法  32-34
    3.2.2 全局相似度估算算法  34
  3.3 本章小结  34-37
第四章 用户兴趣模型  37-43
  4.1 模型的总体结构  37-38
  4.2 兴趣分类参考模型  38
  4.3 用户兴趣树  38-39
  4.4 用户兴趣向量的表示  39-40
  4.5 用户查询到用户兴趣类的映射  40-41
  4.6 本章小节  41-43
第五章 个性化元搜索结果合成  43-61
  5.1 个性化信息检索系统的功能结构  43
  5.2 个性化信息检索系统工作流程  43-46
  5.3 查询参数转换  46-47
  5.4 搜索结果页面信息提取  47-51
    5.4.1 网页信息的提取流程(html)  48-49
    5.4.2 HTML控制符号处理  49-50
    5.4.3 文本信息的预处理  50-51
  5.5 基于用户兴趣的结果合成(PMSRM)  51-56
    5.5.1 改进的摘要/位置法  52-53
    5.5.2 查询结果与用户查询的相似度计算  53-54
    5.5.3 查询结果去重  54
    5.5.4 结果在成员引擎上的得分计算  54-55
    5.5.5 查询结果的合成  55-56
    5.5.6 无效链接检查  56
  5.6 实验分析  56-60
    5.6.1 对重叠文档的两种假设  57-59
    5.6.2 PMSRM与单独搜索引擎比较  59
    5.6.3 PMSRM与几种常用合并算法比较  59-60
  5.7 本章小结  60-61
第六章 总结与展望  61-63
  6.1 论文总结  61
  6.2 研究展望  61-63
致谢  63-65
参考文献  65-69
读研期间研究成果  69

相似论文

  1. 基于用户兴趣特征的图像检索研究与实现,TP391.41
  2. 生物医学领域检索系统查询扩展技术研究,TP391.3
  3. 面向海量邮件的检索系统研究与实现,TP393.098
  4. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  5. 排序学习损失函数的研究,TP181
  6. 基于语义Web的信息检索技术研究,TP391.3
  7. 网络信息提取系统关键技术研究,TP393.09
  8. 基于多Agent及元搜索技术的中文问答系统的研究和应用,TP391.1
  9. Web用户界面定制技术的研究,TP311.52
  10. 服装面料信息管理技术研究,TS941.15
  11. 个性化推荐系统技术与应用,TP18
  12. 语义Web技术在信息检索系统中的应用研究,G354
  13. 粒子群算法在查询优化中的应用,TP391.3
  14. 基于稀疏非负矩阵分解的图像检索,TP391.41
  15. 中文问答系统中多策略答案抽取技术的研究,TP391.3
  16. 信息检索中迁移Markov网络模型的研究,TP391.3
  17. 基于本体的个性化元搜索技术的研究和实现,TP391.3
  18. 基于同义词扩展的贝叶斯网络结构化文档检索模型,TP391.3
  19. 信息检索中的查询扩展技术研究,TP391.3
  20. 中—英文跨语言问答式信息检索技术研究,TP391.3
  21. 基于浏览日志和浏览行为的用户兴趣模型研究,TP393.02

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com