学位论文 > 优秀研究生学位论文题录展示

基于网络流量特征的NAT识别方法

作 者: 高骥翔
导 师: 胡光岷
学 校: 电子科技大学
专 业: 通信与信息系统
关键词: NAT流量识别 网络流量特征 数据挖掘
分类号: TP393.06
类 型: 硕士论文
年 份: 2012年
下 载: 66次
引 用: 0次
阅 读: 论文下载
 

内容摘要


NAT技术大大地减缓了IP地址空间枯竭的问题,实现了私有网络访问公共网络的功能,为用户带来了巨大的便利与实惠。然而,NAT技术也为未经授权的用户非法接入网络提供了便利,给运营商的正常网络运营带来诸多的困难。因此,必须要找到一种行之有效的NAT流量识别方法,以有效区分网络中的NAT设备与单个的普通主机。现有的各种NAT识别方法普遍依赖于IP数据包中的某一特殊字段,一旦该字段被修改,或者本身无法满足识别需求,这些方法将完全失效。而且这些方法还受到了操作系统或用户上网习惯的制约。有鉴于此,本文提出一种基于网络流量特征的NAT识别方法,该方法将不依赖于数据包中的任何特殊字段,不依赖于操作系统和用户的操作习惯。考虑到NAT流量识别本质上是将网络中的IP地址划分为NAT设备与普通主机两大类的一个分类问题,该问题其实可以看作是数据挖掘技术中最为典型的二类分类问题,本文将数据挖掘技术引入到NAT流量识别的问题中。本方法的总体思想是获取网络中所有IP地址的网络流量特征,然后以各个IP地址作为数据挖掘中的实例,以其特征参数作为数据挖掘中的属性,通过数据挖掘将IP地址划分为NAT设备与普通主机两大类,进而完成NAT的识别。本方法的核心部分是网络流量特征,这是采用数据挖掘技术实现NAT设备与普通主机的划分的基础,也是直接影响本方法的识别效果的关键因素。本文通过对NAT设备和普通主机的网络流量的特点进行对比分析,总结得出十一种反映NAT设备与普通主机之间的差异的NAT流量特征,并通过这些流量特征,归纳出一个包含28种流量特征参数的NAT流量特征参数集。同时,本文对参数集中各个特征参数的分类性能进行了测试,测试结果表明该NAT流量特征参数集对NAT设备和普通主机具备较高的区分度。本文的主要工作是,对采集到的网络流量数据进行特征提取和特征选择等处理,获取到网络中所有IP地址的NAT流量特征参数集,然后通过数据挖掘的方法,将这些IP地址划分为NAT设备与普通主机两大类,从而实现NAT的识别。本文采用了三种数据挖掘算法,包括两种有监督的分类算法,C4.5决策树算法和朴素贝叶斯算法,以及一种无监督的聚类算法,K-均值聚类算法。通过对不同算法的实验结果进行对比分析,验证了本方法的有效性和准确性。最后,对P2P流对算法性能的影响进行了检验,实验结果表明其影响在可接受范围以内。

全文目录


摘要  4-6
ABSTRACT  6-12
第一章 绪论  12-17
  1.1 研究背景  12-13
  1.2 国内外研究现状  13-15
  1.3 本文主要研究内容  15-16
  1.4 本文章节安排  16-17
第二章 NAT与 NAT流量识别方法概述  17-29
  2.1 NAT技术概述  17-23
    2.1.1 NAT技术产生背景  17-18
    2.1.2 NAT技术简介  18-20
    2.1.3 NAT技术分类  20-22
    2.1.4 NAT技术带来的问题  22-23
  2.2 NAT流量识别方法概述  23-29
    2.2.1 基于 TCP/IP 协议特征字段的识别方法  23-26
    2.2.2 基于应用层信息的识别方法  26-28
    2.2.3 现有方法存在的问题  28-29
第三章 基于网络流量特征的 NAT识别方法  29-46
  3.1 基于网络流量特征的 NAT识别方法概述  29-32
  3.2 NAT流量特征参数的选取  32-37
    3.2.1 NAT的流量特征总结  32-36
    3.2.2 NAT流量特征参数集  36-37
  3.3 特征参数的分类性能的测试与分析  37-46
    3.3.1 特征参数的分类性能的测试与分析  37-44
    3.3.2 P2P 流对特征参数分类性能的影响的分析  44-46
第四章 NAT识别算法研究  46-59
  4.1 数据挖掘技术概述  46-48
    4.1.1 数据挖掘技术的定义与分类  46-47
    4.1.2 数据挖掘技术的步骤  47-48
  4.2 有监督的分类算法  48-55
    4.2.1 分类方法简介  48-49
    4.2.2 决策树算法  49-53
    4.2.3 朴素贝叶斯算法  53-55
  4.3 无监督的聚类算法  55-59
    4.3.1 聚类方法简介  55-56
    4.3.2 K-均值聚类算法  56-59
第五章 实验及结果分析  59-79
  5.1 实验数据采集与特征提取  59-67
    5.1.1 网络环境搭建  59-60
    5.1.2 数据采集  60-63
    5.1.3 数据预处理  63
    5.1.4 特征提取  63-64
    5.1.5 特征选择  64-67
  5.2 实验结果及分析  67-79
    5.2.1 性能参数定义  67-68
    5.2.2 有监督的分类算法的实验结果及分析  68-73
    5.2.3 无监督的聚类算法的实验结果及分析  73-75
    5.2.4 数据选择前后算法性能的比较与分析  75-77
    5.2.5 P2P 对算法性能影响的检测与分析  77-79
第六章 结束语  79-81
  6.1 全文总结  79-80
  6.2 进一步工作的展望  80-81
致谢  81-82
参考文献  82-85
攻硕期间取得的研究成果  85-86

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于行业参数优化模型的投资项目决策支持系统,F283
  13. 数据集市在电信经营分析中的应用研究,TP311.13
  14. 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
  15. 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
  16. 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
  17. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  18. 教学质量评估数据挖掘系统设计与开发,TP311.13
  19. 关联规则挖掘在交通事故成因分析中的应用,U491.31
  20. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  21. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com