学位论文 > 优秀研究生学位论文题录展示
Web预取与缓存一体化模型研究
作 者: 宋冰
导 师: 石磊
学 校: 郑州大学
专 业: 计算机应用技术
关键词: Web缓存 Web预取 序列模式 可预取性 预取控制
分类号: TP311.10
类 型: 硕士论文
年 份: 2006年
下 载: 183次
引 用: 3次
阅 读: 论文下载
内容摘要
缓存技术和预取技术是解决Web访问延迟问题的主要方案。虽然缓存技术在互联网上有着非常广泛的应用,但是单纯的缓存机制只是利用WWW的访问模式的时间局部性,对于未曾访问过的内容无法缓冲,响应性能依然得不到很大改善。而预取技术是缓存技术的一种有效补充手段,是突破缓存性能上限的最有效的方法。预取可以对用户未请求过的页面进行缓冲,是一种主动的高速缓冲,是缓冲机制由时间局部性向空间局部性的扩展。预取技术在实际应用中必须解决好两个问题,一是预测——推测用户将要访问的Web对象,决定哪些Web对象值得预取;二是预取控制,其效果将直接决定预取技术能否在较大范围中推广而不对网络性能产生严重的负面影响。因此需要根据系统状态决定实际预取哪些Web对象、具体预取多少Web对象,避免消耗过多的网络资源。预取技术和缓存技术的结合可以在Web应用中大大减少用户请求后的等待时间。本文提出了在预取缓存一体化条件下的预取控制策略,并给出了Web对象可预取性的度量方法。 论文首先介绍了互联网所面临的问题及解决方案。然后阐述了缓存和预取技术的基本概念及缓存系统和预取系统的分类与结构,并总结了现有的缓存替换算法和特点,以及现有预测算法和预取控制策略。 接着,介绍了序列模式挖掘相关知识,并详细描述了本文预测模型中采用的基于位图深度优先挖掘算法。该序列模式挖掘采用不同于传统序列挖掘的宽度优先,而是采用基于字典树数据结构的深度优先,同时采用位图保存和计算各序列的支持度,能够较迅速的挖掘出频繁序列。 然后,详细讨论了Web对象的可预取性概念及相应的度量方法。接着在考虑预取-缓存交互的情况下,建立了三种预取控制模型,通过分析预取控制的代价函数,得到进行有效预取控制的阈值,并讨论了预取阈值的下限。预取那些被访问概率超过阈值的对象,能够使得预取代价最小,从而达到进行有效预取控制的目的。模拟实验表明,在预取与缓存交互的条件下,该控制模型能够较好地控制预取,减少系统资源和网络资源的过度消耗。同时给出在不同缓存容量大小和替换算法条件下的真实日志的应采用的预取阂值。 最后,利用上述基于序列模式挖掘的预测模型在预取缓存一体化的条件下对其进行的模拟实验表明该模型具有较好的性能。
|
全文目录
第一章 绪论 8-12 1.1 互联网所面临的问题及解决方案 8-9 1.2 课题的研究背景 9-10 1.3 研究课题描述 10-12 第二章 Web缓存及预取技术 12-21 2.1 Web访问模式特性 12-14 2.1.1 Zipf法则 12-13 2.1.2 时间局部性 13 2.1.3 空间局部性 13-14 2.2 Web缓存系统 14-16 2.2.1 缓存分类 14-15 2.2.2 缓存替换算法 15 2.2.3 缓存的优缺点 15-16 2.3 Web预取系统 16-21 2.3.1 预取概述 16 2.3.2 预取算法 16-18 2.3.3 预取缓存一体化模型 18-21 第三章 序列模式挖掘 21-26 3.1 序列模式简介 21-22 3.2 序列模式挖掘算法 22 3.3 本文采用的序列模式挖掘算法 22-26 第四章 Web对象可预取性研究 26-34 4.1 Web对象可缓存性判断 27-28 4.1.1 根据URL的属性 27 4.1.2 根据请求方法 27 4.1.3 根据HTTP状态码 27-28 4.1.4 根据对象的规模 28 4.2 Web对象的生存期 28-29 4.3 预取控制 29-34 4.3.1 预取控制的必要性 29-30 4.3.2 预取控制模型 30-34 第五章 预取与缓存交互的Web预取控制模型 34-47 5.1 预取缓存一体化概述 34-35 5.2 模型E_M 35-38 5.3 模型E_0 38-40 5.4 模型E_A 40-47 第六章 基于序列模式挖掘的预取算法 47-53 6.1 预测模型 47-50 6.1.1 模型构建 47-49 6.1.2 模型预测 49-50 6.2 测试结果及分析 50-53 第七章 结论与展望 53-54 7.1 结论 53 7.2 未来的研究方向 53-54 致谢 54-55 参考文献 55-60 附录1 攻读硕士期间发表学术论文 60
|
相似论文
- 基于Web挖掘技术研究及其在数字图书馆中的应用,G250.76
- 基于隐私保护的多步攻击关联方法研究,TP311.13
- 高性能网络社区的设计与实现,TP311.52
- DNA序列的最大频繁模式挖掘,TP311.13
- 数据缓存技术在Mashup中的应用研究,TP333
- 数据挖掘在蜜罐日志分析中的应用研究,TP393.08
- 面向校园网日志分析的web数据挖掘技术研究,TP311.13
- 基于关联规则及序列模式的Web日志挖掘系统,TP311.13
- 多相关时间序列异常模式挖掘框架的研究,TP311.13
- 基于双关联图的Web预取模型研究,TP393.09
- 序列模式挖掘在入侵检测系统中的应用研究,TP393.08
- 序列模式挖掘在医疗保险上的应用,TP311.13
- 基于WEB访问特性的代理缓存机制的研究,TP393.06
- 序列模式挖掘的研究与应用,TP311.13
- 不确定序列模式发现与查询算法的研究,TP311.13
- 基于Web日志的序列模式挖掘算法的研究,TP311.13
- 棉纺企业动态成本预测研究,F406.72
- 音乐领域中文实体关系抽取研究,TP391.1
- 基于Web挖掘的网页动态推荐系统研究,TP393.092
- 泛在网络中情景感知业务的实现及用户移动序列模式研究,TP311.13
- 时间序列数据挖掘研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计
© 2012 www.xueweilunwen.com
|