学位论文 > 优秀研究生学位论文题录展示
个性化搜索中用户语义意图自动识别技术研究
作 者: 舒平芬
导 师: 王大玲
学 校: 东北大学
专 业: 计算机软件与理论
关键词: 个性化搜索 语义意图 词义消歧 查询上下文 语义相关度 查询扩展
分类号: TP391.1
类 型: 硕士论文
年 份: 2008年
下 载: 47次
引 用: 0次
阅 读: 论文下载
内容摘要
目前大部分搜索引擎采用关键词匹配技术,即相同的查询关键词将返回相同的查询结果。而实际上,对于同一个查询词,不同的用户其查询意图可能不同,同一个用户在不同时期其查询意图也可能不同。个性化搜索技术正是为解决这一问题应运而生的,旨在为用户不同的信息需求提供个性化的搜索结果。查询词多义性问题的研究是实现个性化搜索的有效途径之一。查询词的多义性降低了搜索结果的准确率。为解决这一问题,本文提出对用户提交的具有多义的查询词进行用户语义意图自动识别的思想。用户的语义意图是指用户想表达的该查询词在当前会话中的真实语义,而基于Web环境的语义消歧是识别用户语义意图的关键技术之一。本文重点研究基于上下文的查询消歧和无上下文查询中的语义消歧问题,并讨论了基于用户语义意图的查询扩展技术。无上下文查询中的语义消歧是本文的一个创新点。针对现有的查询消歧方法不能解决单个多义查询词的消歧问题,本文提出一种新颖的解决方案——基于隐含上下文的查询消歧方法ICBWSD。该方法通过记录相邻的前一次查询和当前查询中用户点击的文档信息来获取查询词的隐含上下文,再应用基于上下文的消歧方法对目标词进行消歧。实验证明了ICBWSD方法的可行性和推断用户查询意图的乐观前景。
|
全文目录
摘要 6-7 Abstract 7-11 第1章 绪论 11-15 1.1 问题提出 11-12 1.2 解决方案 12-13 1.3 研究的实际意义 13 1.4 本文的组织结构 13-15 第2章 个性化搜索技术研究 15-21 2.1 个性化搜索概述 15 2.2 个性化搜索的现状 15-16 2.3 个性化搜索中的用户建模 16-19 2.3.1 用户兴趣模型 17-18 2.3.2 用户意图模型 18-19 2.3.3 用户目标的研究 19 2.4 用户语义意图与个性化搜索 19-20 2.5 本章小结 20-21 第3章 基于查询上下文的语义消歧 21-39 3.1 基于Web消歧方法的特性 21-22 3.2 WordNet简介 22-23 3.2.1 WordNet的心理语言学假设 22 3.2.2 WordNet的内容 22-23 3.3 语义相关度 23-28 3.3.1 语义相关度的概念 23-24 3.3.2 语义相关性度量 24-28 3.4 基于查询上下文的语义消歧 28-32 3.4.1 基于查询上下文的语义消歧现状 28-29 3.4.2 本文采用的消歧算法 29-32 3.4.2.1 窗口大小 29-30 3.4.2.2 算法描述 30-32 3.5 实验及结果分析 32-38 3.5.1 SENSEVAL-2数据集 33-35 3.5.2 评价标准 35-36 3.5.3 窗口大小的选取对消歧算法的影响 36-37 3.5.4 语义相关度的选取对消歧算法的影响 37-38 3.6 本章小结 38-39 第4章 无上下文查询中的语义消歧 39-53 4.1 无上下文查询中语义消歧的意义 39-40 4.2 基于隐含上下文的查询消歧框架 40-41 4.3 获取隐含上下文 41-44 4.3.1 会话边界检测 42-43 4.3.2 文档特征提取 43-44 4.4 基于隐含上下文的查询消歧 44-46 4.5 实验及结果分析 46-51 4.5.1 评价标准 47 4.5.2 案例分析 47-51 4.5.2.1 样例的WordNet语义 48-49 4.5.2.2 消歧结果分析 49-51 4.6 本章小结 51-53 第5章 基于用户语义意图的查询扩展 53-59 5.1 查询扩展的研究现状 53-54 5.2 用户语义意图的形式化表征 54-55 5.3 基于用户语义意图的查询扩展 55-57 5.3.1 选择扩展查询词 56 5.3.2 计算扩展查询词权重 56-57 5.4 用户查询与文档的语义相似度计算 57-58 5.5 本章小结 58-59 第6章 总结与展望 59-61 6.1 本文主要工作总结 59-60 6.2 未来工作展望 60-61 参考文献 61-67 致谢 67-69 攻硕期间参加的项目及发表的论文 69
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 基于中文维基百科的语义相关度计算的研究与实现,TP391.1
- 基于移动搜索用户关联的信息检索研究,TP391.3
- 以博客内容为对象的个性化搜索研究,TP391.3
- 面向移动搜索的PUSH平台的设计与实现,TP391.3
- 基于本体的个性化元搜索引擎研究,TP391.3
- 个性化搜索中用户兴趣挖掘技术方法研究,TP311.13
- 基于兴趣多边形的个性化搜索系统的研究与实现,TP391.3
- 基于主题信息服务的垂直搜索引擎的设计与实现,TP391.3
- 一种基于主题数据的存取调度模型的研究,TP391.3
- 基于互信息的语义查询扩展技术研究,TP391.1
- 基于用户兴趣模型的个性化推荐与搜索系统的研究,TP391.3
- 利用文档分类结构的信息检索技术,TP391.3
- 基于综合倒排索引的个性化搜索技术研究,TP391.3
- 教育资源配送系统中智能化搜索的研究,TP391.3
- 基于内容的教学资源搜索引擎研究,TP391.3
- 具有自然语言理解和信息挖掘能力的搜索引擎开发,TP391.3
- 元搜索引擎个性化搜索的研究与设计,TP391.3
- 基于知网的多关键字检索研究,G354
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|