学位论文 > 优秀研究生学位论文题录展示
自适应网络信息获取服务技术研究
作 者: 刘康苗
导 师: 陈纯;卜佳俊
学 校: 浙江大学
专 业: 计算机科学与技术
关键词: 网络信息获取 自适应技术 信息拉取 信息推送 查询歧义性 个性化建模 分布式索引组织策略
分类号: G250.73
类 型: 博士论文
年 份: 2008年
下 载: 538次
引 用: 0次
阅 读: 论文下载
内容摘要
网络技术的发展带来了可获取信息资源的极大丰富,但是网络资源的无序、良莠不齐等缺点也给用户获取网络信息带来了困难。网络信息获取服务是指在互联网上,针对个人用户的网络信息需求,以现代信息技术为手段,向用户提供所需的互联网信息产品及服务,其服务模式包括信息拉取和信息推送。自适应网络信息获取服务技术,则是根据用户需求、信息源特征、系统负载等因素,自适应地动态调整自身行为,高效、人性化地提供高质量的信息。准确、全面地感知用户需求,是实现网络信息获取服务的基础。网络用户既是网络信息资源的利用者又是提供者,因此可以通过分析用户的浏览内容、行为和发布的信息等来获取用户需求。获得用户需求后,如何在浩瀚的网络信息资源中筛选出相关的信息,并以更人性化的方式展现给用户,是网络信息获取服务成功的关键。此外,用户对信息获取的时效性通常有较高的要求,如何保障信息获取系统的性能也是网络信息获取服务的重要研究内容之一。为解决上述问题,本文首先提出了一种基于查询歧义性衡量的自适应信息拉取技术。对用户请求进行歧义性衡量,根据其歧义性自适应地决定结果的展现方式;在结果筛选和展现方面,分别提出了多特征融合排序算法和聚类算法;并在互联网颇具代表的新兴资源:多媒体信息(以图像为例)和更新频繁的动态资源(以博客为例)上得到了验证。其次,本文针对网络活动中的信息发布者和信息浏览者各提出了一种基于个性化建模的自适应信息推送技术:对于信息发布者,以当前网络流行的博客这一个性化信息发布平台为研究环境,提出了一种利用博客文章对用户进行长短期兴趣建模的方法,并对博客空间进行社群划分,实现了兴趣相似好友的推荐;对于信息浏览者,利用用户当前浏览网页的内容作为用户个性信息的表征,提出了一种基于情感和主题分析的上下文广告推荐技术,使推送的广告不仅主题相关,而且与网页内容中潜在的用户情感相符合,从而更具针对性。接着,针对网络信息获取服务在性能、可扩展性等方面的需求,以信息拉取服务的典型应用——搜索引擎为切入点,提出了一种具有较好可扩展性的混合型分布式索引组织策略(Loc-Glob)。并在Loc-Glob索引组织策略之上进行性能优化:基于索引词负载及动态变化查询流,重新分布和冗余索引;基于索引服务器的实时系统负载,实现查询路径的自适应优化。基于上述研究,本文设计并实现了一个采用自适应技术的博客空间信息获取原型系统,提供了博客搜索引擎、博客好友推荐、广告推荐等多种应用服务,验证了本文针对信息拉取和信息推送两类服务模式提出的多项自适应技术的可行性。文章最后对本文的研究工作进行了总结和展望。
|
全文目录
摘要 4-6 Abstract 6-13 第1章 绪论 13-23 1.1 引言 13-14 1.2 网络信息资源与网络信息获取服务 14-15 1.3 自适应网络信息获取服务技术的提出 15-16 1.4 自适应网络信息获取服务技术的核心问题 16-18 1.4.1 个性化用户需求感知 17 1.4.2 针对性信息筛选 17-18 1.4.3 人性化结果展现 18 1.4.4 高效性能保障 18 1.5 研究目标与方法 18-20 1.6 本文的研究内容和结构安排 20-23 第2章 自适应网络信息获取服务技术综述 23-40 2.1 网络信息获取服务综述 23-27 2.1.1 网络信息拉取服务 23-25 2.1.2 网络信息推送服务 25-27 2.2 网络信息拉取服务技术 27-34 2.2.1 用户意图识别 27-29 2.2.2 相关排序技术 29-32 2.2.3 结果展现 32-33 2.2.4 网络信息拉取服务技术的挑战 33-34 2.3 网络信息推送服务技术 34-39 2.3.1 基于内容的信息推送 35-36 2.3.2 协同过滤信息推送 36-37 2.3.3 混合型信息推送 37-38 2.3.4 网络信息推送服务技术的挑战 38-39 2.4 本章小结 39-40 第3章 基于查询歧义性衡量的自适应信息拉取技术 40-75 3.1 概述 40-42 3.2 查询歧义性衡量 42-46 3.2.1 查询歧义性衡量相关研究 43 3.2.2 量化查询歧义性 43-44 3.2.3 基于ODP的歧义性衡量实验 44-46 3.3 基于特征融合的排序机制 46-63 3.3.1 多特征融合互联网图像排序 46-54 3.3.2 基于多特征的博客文章排序 54-63 3.4 基于多特征的互联网资源聚类 63-73 3.4.1 视觉和语义特征融合的图像聚类 63-73 3.5 本章小结 73-75 第4章 基于个性化建模的自适应信息推送技术 75-99 4.1 概述 75-76 4.2 基于博客社群划分的好友推荐 76-84 4.2.1 博客用户个性化建模 77-82 4.2.2 博客社群分析相关工作 82-83 4.2.3 基于Normalized Cut的博客社群划分 83-84 4.2.4 基于博客社群的好友推荐技术 84 4.3 互联网多维上下文广告推荐 84-97 4.3.1 相关研究工作 86-88 4.3.2 多维上下文广告推荐技术 88-93 4.3.3 实验与结果讨论 93-97 4.4 本章小结 97-99 第5章 支撑高效服务的自适应分布式索引组织策略 99-118 5.1 概述 99-100 5.2 Loc-Glob:一种混合型分布式索引组织策略 100-107 5.2.1 分布式索引组织策略分析 101-103 5.2.2 Loc-Glob分布式索引组织策略 103-105 5.2.3 Loc-Glob的查询处理策略 105-106 5.2.4 Loc-Glob的可扩展性分析 106-107 5.3 Loc-Glob的查询性能评估 107-110 5.3.1 查询性能评估 108-109 5.3.2 负载均衡评估 109-110 5.4 基于索引词负载及实时系统负载的自适应性能优化 110-116 5.4.1 基于索引词负载的索引重分布 111-113 5.4.2 基于索引词负载的索引冗余与查询路径优化 113-116 5.5 本章小结 116-118 第6章 博客空间自适应信息获取服务系统设计与实现 118-128 6.1 系统概述 118-119 6.2 系统设计与实现 119-124 6.2.1 博客搜索子系统 119-121 6.2.2 博客好友推荐子系统 121-122 6.2.3 广告推荐子系统 122-124 6.3 原型系统分析与讨论 124-127 6.4 本章小结 127-128 第7章 总结与展望 128-133 7.1 总结 128-129 7.2 展望 129-133 参考文献 133-145 攻读博士学位期间主要的研究成果 145-149 学术论文 145-147 发明专利 147 软件著作权 147-148 科研项目 148-149 致谢 149-151 作者简历 151
|
相似论文
- 锥模型信赖域算法的改进研究,O224
- 动态系统的鲁棒故障诊断与容错控制技术研究,TP13
- MIMO-OFDM系统中信道估计和载波频偏估计技术的研究,TN913.6
- OFDM系统中资源分配技术研究,TN919.3
- 面向用户的数字信息推送服务质量评价体系研究,G252
- 基于Web2.0的农村科技信息推送系统设计与实现,TP311.52
- 基于移动终端的旅游信息推送服务系统关键技术研究,TN929.53
- 基于RSS技术的政府绩效信息聚合与推送研究,D630
- 运营商多媒体信息推送平台的设计及实现,TP311.52
- 无线多播中数字喷泉码和叠加编码的联合及优化研究,TN929.5
- 基于消息中间件的服务器推送技术的应用研究,TP393.05
- 3GPP LTE链路自适应技术及其在协作通信中的应用,TN929.5
- 协同系统链路自适应技术的研究,TN929.5
- LDPC码在COFDM通信系统下的研究与实现,TN919.3
- 求解非线性互补问题的光滑信赖域方法,O224
- 新锥模型信赖域算法研究,O241
- 非线性等式约束优化问题的信赖域滤子算法研究,O221.2
- RSS技术在图书馆的应用,G250.7
- MIMO-OFDM系统自适应功率比特分配算法研究,TN919.3
- OFDM-UWB系统自适应动态资源分配算法研究,TN925
- 基于无线感知反应网络的智能楼宇管理平台的设计与实现,TP212.9;TP273.5
中图分类: > 文化、科学、教育、体育 > 信息与知识传播 > 图书馆学、图书馆事业 > 图书馆学 > 图书馆自动化、网络化 > 网络资源开发与利用
© 2012 www.xueweilunwen.com
|