学位论文 > 优秀研究生学位论文题录展示

基于聚类分析的P2P流量识别算法的研究

作 者: 赵凯
导 师: 史长琼
学 校: 长沙理工大学
专 业: 计算机应用技术
关键词: 聚类分析 P2P流量识别 P2P流量特征 BIRCH 贝叶斯信息准则
分类号: TP393.02
类 型: 硕士论文
年 份: 2011年
下 载: 7次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着当代互联网应用的发展,P2P(Peer-to-Peer)已经成为发展最快的网络应用之一。由于P2P技术具有文件共享、分布计算等优点,使得P2P流量占据了网络流量大部分的同时其技术也得到了广泛的应用。但P2P技术所带来的网络拥塞和资源的过度占用等一系列问题对于正常网络业务的发展是一种阻碍。为了保证网络正常有序的运行,有必要对P2P流量进行管理,这是在享受P2P带来的便利的同时必须要考虑的一个问题。然而,随着P2P技术的飞速发展,P2P应用为了避免自身被轻易察觉出来,纷纷采用了各种技术如动态端口、协议字段加密等,P2P流量识别技术也随之面临着严峻的挑战。由于端口跳变,负载加密等流量隐藏技术的发展,利用应用端口和内容等的显式特征P2P流量识别方法已经逐步被淘汰。因此,实现P2P流量的有效识别已经成为急需解决的问题。本文就基于聚类分析的P2P流量识别问题展开了研究,其主要的研究工作和创新点为:(1)针对P2P流量识别问题的研究背景和意义,国内外研究的现状,以及P2P技术的发展所带来的一系列问题,研究了当前存在的几种典型的P2P流量识别方法,并分析了这些识别方法在识别P2P流量过程中的特点和存在的问题。(2)对P2P流量的特征进行了比较深入的分析和研究,通过实验选取了五种能够显著区分P2P流量的属性特征,并提出将下载与上传速度比属性用于P2P流量的识别中,五种特征属性的结合在保留了P2P流量特征中尽可能多的信息同时,最大程度的降低了属性之间存在的较多冗余度,从而能够更有效更精确的识别P2P流量。(3)给出了一种基于聚类分析的P2P流量识别算法,该方法将数据集分解为子聚类的集合以降低聚类问题的规模,并减少I/O处理的复杂度。同时,算法中加入的贝叶斯信息判别准则能够选择出最佳的聚类模型,从而达到自动划分聚类数的目的,尽可能的减少了识别过程中人为因素的影响。通过实验表明,该算法的准确性较高,并且误判率较低。

全文目录


摘要  5-6ABSTRACT  6-10第一章 绪论  10-15  1.1 课题的研究背景及其意义  10-11  1.2 国内外研究现状  11-13  1.3 本文所做的主要工作及创新点  13-14  1.4 本文的组织结构  14-15第二章 P2P 流量识别技术  15-25  2.1 P2P 简介  15  2.2 P2P 业务及其发展过程  15-18    2.2.1 集中式结构P2P 网络  15-16    2.2.2 纯分布式结构P2P 网络  16-17    2.2.3 混合式结构P2P 网络  17-18  2.3 P2P 技术存在的安全问题  18-19  2.4 典型的P2P 流量识别技术分析  19-23    2.4.1 端口识别技术  19-20    2.4.2 深层数据包检测技术(DPI)  20-21    2.4.3 基于流特征的流量识别技术  21-23    2.4.4 其他识别技术  23  2.5 本章小结  23-25第三章 P2P 流量特征的分析及属性的选取  25-34  3.1 P2P 的流量特征分析  25-27    3.1.1 P2P 的高速增长特性  25-26    3.1.2 P2P 流量分布的非均衡特性  26    3.1.3 上下行流量对称特性  26-27  3.2 P2P 流量识别中属性的选取  27-33    3.2.1 流的包大小均方差  29    3.2.2 流的包大小变换率  29-30    3.2.3 流的持续时间  30    3.2.4 流中数据包平均字节数  30-31    3.2.5 下载与上传速度比  31-33  3.3 本章小结  33-34第四章 基于聚类分析的P2P 流量识别算法  34-45  4.1 聚类分析  34-35  4.2 层次聚类算法  35-36    4.2.1 簇  35    4.2.2 距离的度量  35-36  4.3 分层的平衡迭代归约及聚类  36-37    4.3.1 聚类特征  36    4.3.2 聚类特征树  36-37  4.4 基于聚类分析的P2P 流量识别算法  37-44    4.4.1 构造聚类特征树  38-40    4.4.2 重建聚类特征树  40-41    4.4.3 划分聚类数目  41-44  4.5 本章小结  44-45第五章 实验测试及结果分析  45-49  5.1 算法可行性的实验及分析  45-47  5.2 算法运算时间及识别准确率的比较  47-48    5.2.1 算法运算时间  47    5.2.2 识别的准确率和误判率  47-48  5.3 本章小结  48-49第六章 结论与展望  49-51  6.1 结论  49  6.2 展望  49-51参考文献  51-56致谢  56-57附录(攻读硕士学位期间发表录用论文)  57-58中文详细摘要  58-60英文摘要  60-62

相似论文

  1. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  2. 高血压前期证候特征研究,R259
  3. 大学生综合素质测评研究,G645.5
  4. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  5. 21个荷花品种遗传多样性的ISSR分析,S682.32
  6. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  7. 南通市农业面源污染负荷研究与综合评价,X592
  8. 土壤环境功能区划研究,X321
  9. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  10. 大豆杂种优势及其遗传基础研究,S565.1
  11. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  12. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  13. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
  14. 云南省直管县改革研究,D630
  15. 基于分治法的聚类方法研究,TP311.13
  16. 三十种中成药元素含量分析及基于元素含量的中成药分类研究,R286.0
  17. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  18. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  19. 重庆文化产业竞争力研究,F224
  20. 草原公路光环境对驾驶员生理指标的影响研究,U491.254

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com