学位论文 > 优秀研究生学位论文题录展示

Web流量特征模型的研究和应用

作 者: 王会霞
导 师: 石磊
学 校: 郑州大学
专 业: 计算机应用技术
关键词: Web缓存 齐普夫定律 Web访问特征 时间局部性 空间局部性 Web预取 模拟器
分类号: TP393.06
类 型: 硕士论文
年 份: 2007年
下 载: 147次
引 用: 2次
阅 读: 论文下载
 

内容摘要


Web缓存技术是提高Web性能的一种有效方法。Web缓存管理是Web缓存技术的核心问题,研究Web访问特征的数学模型是有效进行Web缓存管理的基础。通过对Web用户的行为跟踪,对Web对象访问特征的深入研究分析,发现Web对象访问具有以下几个共同特征:(1)web对象流行度满足Zipf定律;(2)Web对象大小服从重尾分布;(3)Web对象访问具有局部性特征等。访问局部性特征对缓存和预取系统的性能和设计方面有很大的影响。网络访问的局部性特征包括时间局部性空间局部性,利用数学建模方法研究局部性特征对于缓存和预取系统的设计及性能提高具有重要的作用。通过分析和讨论,本文利用信息熵和变异系数建立了网络流量局部性特征新的度量方法,信息熵比Zipf定律更能反映访问流的时间局部性,变异系数则解决了访问流的相同文档间的空间局部性建模问题。实验和分析表明这些参数能较好地描述网络访问流的局部性特征,而且易于使用。Web日志生成模拟器可以按用户指定的Web访问特征生成模拟日志,为研究Web缓存系统性能提供了理论基础。本文通过分析Web对象访问特征,采用数学模拟方法分别模拟了Web对象流行度特征、Web对象大小重尾分布特征以及Web访问的时间局部性特征,设计并实现了一个Web流量特征模拟生成器WebSimGen,并通过实验验证了这个模拟器的有效性。基于两层代理缓存结构,利用模拟生成的日志,用ADF模型(Aggregation、Disaggregation和Filtering)对模拟Web流量的访问特征和性能进行测试,实验结果表明模拟日志具有和真实日志类似的特性。本文还利用WebSimGen模拟器生成的访问日志以及真实的访问日志对常用的Web缓存替换算法(LRU,LFU,GDSF)进行了细致的性能评估,通过实验进一步证明:在两层代理缓存结构中,当低一级缓存用LRU或LFU替换算法时,高一级的缓存用GDSF替换算法能达到比较高的命中率。由于该流量模拟器具有较大的灵活性,其为进一步提高Web缓存性能和预取技术的研究提供了重要依据。

全文目录


摘要  3-4
Abstract  4-6
目录  6-8
图表目录  8-9
第一章 绪论  9-13
  1.1 互联网所面临的问题及解决方案  9-11
  1.2 课题的研究背景  11
  1.3 研究内容和论文组织  11-13
第二章 Web缓存技术背景  13-21
  2.1 Web缓存  13-16
    2.1.1 代理服务器  13-14
    2.1.2 常见的 Web缓存体系结构  14-16
  2.2 缓存替换策略  16-18
  2.3 衡量缓存替换算法性能的主要指标  18-19
    2.3.1 缓存文档命中率  18
    2.3.2 缓存的文档字节命中率  18-19
  2.4 缓存数学模型  19-21
第三章 Web访问特征  21-28
  3.1 Web对象流行度特征  21-24
    3.1.1 Zipf法则(Zipf's law)  21-22
    3.1.2 Web对象流行度特征  22-24
  3.2 Web访问局部性特征  24-25
    3.2.1 时间局部性  24-25
    3.2.2 空间局部性  25
  3.3 Web文档大小重尾分布特征  25-26
  3.4 本章小结  26-28
第四章 Web访问流的局部性特征建模  28-35
  4.1 文档的相关访问模型  28-29
  4.2 度量 Web对象访问的局部性  29-32
    4.2.1 流行度的度量:信息熵  30-31
    4.2.2 相关性的度量:变异系数  31-32
  4.3 实验  32-34
    4.3.1 文档访问距离的验证  32-33
    4.3.2 两种测量方法的验证  33-34
  4.4 本章小结  34-35
第五章 WebSimGen模型研究和应用  35-49
  5.1 背景工作  35-38
  5.2 网络流量特征模型  38-40
    5.2.1 文档流行度模型  38-39
    5.2.2 文档大小分布模型  39-40
    5.2.3 时间局部性模型  40
  5.3 验证模拟器的有效性  40-44
    5.3.1 验证模拟日志的特征  41
    5.3.2 验证模拟日志的性能  41-44
  5.4 多层缓存结构的性能和评估  44-47
    5.4.1 在代理缓存结构中用真实日志(Clark)  45-46
    5.4.2 在代理缓存结构中用模拟日志  46-47
  5.5 本章小结  47-49
第六章 结论与展望  49-50
  6.1 结论  49
  6.2 进一步的工作  49-50
致谢  50-51
参考文献  51-55
附录1 攻读硕士期间发表学术论文  55

相似论文

  1. 自动变速器负载模拟器的设计与研究,TH132.46
  2. 低轨卫星移动信道特性模拟硬件实现,TN927.23
  3. 飞行模拟中飞行管理计算机系统CDU组件设计与仿真,TP391.9
  4. 空中目标抗干扰识别跟踪系统,TN215
  5. 多音频短波信道模拟器的研究与实现,TN925
  6. InGaN太阳能电池的建模仿真与设计,TM914.4
  7. 盘阵列中基于分组的缓存优化技术研究与实现,TP333
  8. 基于PDNS的BitTorrent流量局域化算法的仿真与实现,TP393.093
  9. 一种对等网络文件共享算法仿真与性能分析比较,TP393.09
  10. 驾驶模拟器方向盘实时力感模拟的研究,U463.46
  11. 云计算背景下基于FPGA的文件管理系统与Web缓存的紧耦合研究与分析,TP333
  12. 基于特征场景模拟器的虚拟机性能测试研究,TP302
  13. 车辆驾驶模拟器视景仿真技术研究,TP391.9
  14. 典型航母编队电磁环境模拟研究及设计,U674.7
  15. 驾驶人应激反应能力评估研究,U491.25
  16. 高性能网络社区的设计与实现,TP311.52
  17. 基于Watterson模型的窄带短波信道仿真及其实现,TN925
  18. 一种快速稳定的星图识别方法及单星模拟器的调校,O438
  19. 基于模拟实验的驾驶员期望车速模型研究,U491
  20. 某型战机飞行模拟器三自由度运动平台的设计,V216.8
  21. MHS系统模拟器的设计与实现,TP29-A7

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com