学位论文 > 优秀研究生学位论文题录展示

基于本体的个性化信息系统的应用研究

作 者: 刘佳音
导 师: 王晓耘
学 校: 杭州电子科技大学
专 业: 管理工程与科学
关键词: 个性化信息检索系统 本体 用户模型 文本挖掘 查询扩展
分类号: F49
类 型: 硕士论文
年 份: 2009年
下 载: 57次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网技术的快速发展,网络信息资源呈现出一种爆炸式的增长态势,与此同时增加的还有人们的信息需求量,但是要从这个庞大的信息海洋中快速并准确地定位到自己所需要的信息,却比较困难,进而导致了所谓的“信息过载”和“信息迷向”问题。其中,最主要的原因是通用搜索引擎没有将用户的个性化需求纳入到检索过程中,提供千篇一律的检索结果。因此,如何了解用户意图,掌握用户的个性化信息,并提供个性化服务成为信息检索领域中许多学者的研究热点。本文构建了个性化信息检索系统(Personalized Information Retrieval System,简称PIRS),将传统的信息检索系统与用户模型有机地结合起来,建立面向用户兴趣的个性化信息检索系统。PIRS系统主要实现了用户兴趣的识别,用户模型的构建与学习,查询扩展,以及根据查询结果和用户兴趣的匹配程度提供个性化服务等。其中,本文研究的主要内容有:(1)论述了信息检索技术的研究现状,分析其中存在的问题,进而提出PIRS系统的研究意义。在此基础上,分析了个性化信息检索的业务流程,给出PIRS系统的框架结构和总体设计。(2)从用户个性化模型构建的各个阶段出发,分别进行了相关的研究,包括:①领域本体的构建。利用文本挖掘技术获取相关词语,以此协助领域专家完成领域本体的半自动构建。②初始化用户模型的构建。根据用户所提交的基本信息,通过本体投影的方式获取用户初始个性化模型,并给出本体投影的算法。③个性化用户模型的学习更新。分析用户的检索或浏览的行为,以此构建参考本体,再将其归并到用户模型中,从而实现用户个性化模型的学习和更新。(3)将用户模型应用到个性化信息检索环境中,主要包括以下两个方面:①查询扩展。针对用户输入的三种查询模式,即T1 ,2,....,n模式, O1 ,2,....,n模式, T1 ,2,...., n + O1,2,....,n模式,我们分别设计了相应的扩展算法,使得查询词可以更好地反映用户的需求;②查询结果集合的过滤和优化。根据余弦定理计算文档与查询词的相关度,再将大于指定阈值的文档以降序的方式呈现给用户。(4)利用Sogou实验室提供的搜索日志,设计实验验证个性化信息检索系统的可行性和有效性。实验结果证明,基于本体的个性化信息检索系统在相对查全率和相对查准率方面,比基于关键词的信息检索有一定的改进。

全文目录


摘要  5-6
ABSTRACT  6-11
第1章 绪论  11-18
  1.1 论文的研究背景  11-12
  1.2 国内外研究现状  12-16
    1.2.1 个性化信息检索的研究现状  12-14
    1.2.2 个性化用户模型的研究现状  14-15
    1.2.3 存在的问题  15-16
  1.3 论文的内容与框架  16-17
  1.4 本章小结  17-18
第2章 相关理论概述  18-27
  2.1 信息检索的概念  18
  2.2 信息检索的过程  18-19
  2.3 用户模型  19-22
    2.3.1 用户模型的基本概念  19-20
    2.3.2 用户模型的分类  20
    2.3.3 用户模型的构建  20-22
  2.4 信息检索数学模型  22-26
    2.4.1 布尔模型  23-24
    2.4.2 经典概率论模型  24-25
    2.4.3 向量空间模型  25-26
  2.5 本章小结  26-27
第3章 个性化信息检索的分析与设计  27-32
  3.1 PIRS的设计思想  28-29
  3.2 PIRS的业务流程和总体框架  29-31
    3.2.1 个性化信息检索的业务流程  29-30
    3.2.2 PIRS总体框架  30-31
  3.3 本章小结  31-32
第4章 用户模型的构建  32-45
  4.1 领域本体的构建  33-40
    4.1.1 本体论与领域本体  33-34
    4.1.2 领域本体的构建  34-38
    4.1.3 领域本体的描述语言  38
    4.1.4 PROT(?)G(?)在领域本体中的应用  38-40
  4.2 基于领域本体的用户模型  40-44
    4.2.1 个性化用户模型的形式化描述  40-41
    4.2.2 个性化用户模型的相关定义  41
    4.2.3 构建用户个性化本体  41-44
  4.3 本章小结  44-45
第5章 用户模型的学习更新  45-54
  5.1 用户兴趣的获取  45-47
  5.2 用户模型的学习过程  47-53
  5.3 本章小结  53-54
第6章 用户模型在个性化信息检索中的应用  54-64
  6.1 查询扩展  54-62
    6.1.1 查询扩展概述  54-56
    6.1.2 用户查询行为分析  56-57
    6.1.3 查询扩展  57-59
    6.1.4 查询扩展算法  59-62
  6.2 结果集的过滤和排序  62-63
  6.3 本章小结  63-64
第7章 验证  64-74
  7.1 实验数据的采集  64
  7.2 实验内容  64-68
    7.2.1 文本分析  64-65
    7.2.2 构建领域本体  65-66
    7.2.3 构建用户模型  66-68
  7.3 实验结果及其评估  68-73
    7.3.1 查询扩展词的选择  68-69
    7.3.2 评价输出结果的排序  69-71
    7.3.3 相对查全率和相对查准率  71-73
  7.4 本章小结  73-74
第8章 总结与展望  74-76
  8.1 总结  74
  8.2 展望  74-76
致谢  76-77
参考文献  77-81
附录  81

相似论文

  1. 生物医学领域检索系统查询扩展技术研究,TP391.3
  2. 哲学思想在指导中学数学教学中的作用,G633.6
  3. 基于本体的语义检索研究,TP391.3
  4. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  5. 220kV输电线路除冰机器人机械本体研究,TP242
  6. 基于本体的食品投诉文档文本聚类研究,TP391.1
  7. 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
  8. 关系数据库到RDF(S)映射方法的研究,TP311.13
  9. 基于语义的Web服务发现研究,TP393.09
  10. 基于领域本体的海洋环境数据仓库设计,TP311.13
  11. 数据空间中数据资源之间关联关系发现模型研究,TP311.13
  12. 联合聚类算法研究及应用,TP311.13
  13. 企业级软件组件质量保障与快速部团策略的研究,TP311.53
  14. 情景应对模式下数字化应急预案的语义模型研究,TP391.1
  15. 蛋白质关系网络复合物发现与可视化研究,TP391.41
  16. 美国影评人视野中的中国电影,J905
  17. 英汉跨语言问答系统中的文档语义检索,TP391.1
  18. 基于本体的打印机操作语义查询系统研究与实现,TP391.1
  19. 基于本体的知识组织、检索方法及其实现,TP391.1
  20. 基于关系数据库的OWL本体的提取与存储研究,TP391.1
  21. 素描造型语言的多样性研究,J214

中图分类: > 经济 > 信息产业经济(总论)
© 2012 www.xueweilunwen.com