学位论文 > 优秀研究生学位论文题录展示

“总串分并”四层反垃圾邮件过滤系统研究

作 者: 陈云贵
导 师: 喻国平
学 校: 南昌大学
专 业: 计算机软件与理论
关键词: 反垃圾邮件 FP率 总串分并 贝叶斯
分类号: TP393.098
类 型: 硕士论文
年 份: 2010年
下 载: 18次
引 用: 0次
阅 读: 论文下载
 

内容摘要


伴随着互联网的快速发展,越来越多的网络应用服务走进人们的生活并改变着人们的生活方式。电子邮件(E-Mail)由于方便和低成本的优点已经成为了网民不可缺少的重要通信方式之一。但是与此同时,方便、快捷和低成本的优点也成为垃圾邮件泛滥的诱因之一,再加之电子邮件传输协议的漏洞,垃圾邮件问题已经使整个因特网不堪重负,电子邮件可以说是互联网带给人类最具争议性的副产品之一。从技术层面可以将现有的反垃圾邮件方法大致的划分成两类:“前期发现”与“后期发现”,但不存在一种过滤技术可以独立、完美的完成过滤任务,最可行的方法就是将多种不同的过滤技术整合在一起。目前大多反垃圾邮件产品一般采用分层的思路来整合多种反垃圾邮件技术,一封邮件需要被系统的每一层检测,如果没有一层检评定它为垃圾邮件,方可进入正常邮箱。分层整合的这一特性使得过滤系统赢得了较好召回率,也就是说很少垃圾邮件逃脱。但是简单级联系统的FP率比较差。还有一个常见的整合模型是陪审团机制,该机制中第二层设计为“陪审团层”对第一层的过滤结果进行综合,由于不区别各种过滤器的结果的权重,它的过滤效果也不理想。本文是以反垃圾邮件过滤器整合模型为研究重点,对电子邮件发送接收的体系结构和反垃圾邮件中的主要技术进行了研究,通过对简单级联和陪审团机制的整合模型的研究,分析了它们存在的缺点并提出新的整合结构——“总串分并”式整合方案;最后设计了Mailfilter邮件过滤模块和六层级联过滤模块的对比实验,通过过滤检测验证了新的整合模型在降低FP率方面的良好表现。

全文目录


摘要  3-4
ABSTRACT  4-9
第1章 引言  9-13
  1.1 研究背景  9
  1.2 课题来源  9
  1.3 垃圾邮件的概念  9-10
  1.4 垃圾邮件危害  10-11
  1.5 本人主要工作  11
  1.6 论文组织结构  11-13
第2章 电子邮件体系结构  13-21
  2.1 电子邮件的概述  13-18
    2.1.1 电子邮件体系结构和服务  13-15
    2.1.2 邮件内容格式  15-18
  2.2 邮件传输协议  18-21
    2.2.1 SMTP协议  18
    2.2.2 POP3  18-19
    2.2.3 IMAP  19-20
    2.2.4 WEBMAIL  20-21
第3章 反垃圾邮件技术  21-37
  3.1 我国反垃圾邮件现状  21-22
  3.2 反垃圾邮件技术概况  22-23
  3.3 “前期发现”反垃圾邮件技术  23-28
    3.3.1 邮件认证技术  23-25
    3.3.2 速率控制技术  25-26
    3.3.3 挑战技术  26-27
    3.3.4 IP地址和邮件地址控制技术  27-28
  3.4 基于概率统计的反垃圾邮件技术  28-34
    3.4.1 KNN算法(k-Nearest Neighbor)  28-29
    3.4.2 SVM(Support Vector Machine)支持向量机  29-30
    3.4.3 Winnow方法  30-31
    3.4.4 Bayes方法  31-34
  3.5 基于规则的反垃圾邮件技术  34-37
    3.5.1 Boosting方法  34-36
    3.5.2 决策树方法(Decision Tree)  36-37
第4章 垃圾邮件过滤系统  37-45
  4.1 垃圾邮件过滤原则及评判  37-38
    4.1.1 垃圾邮件过滤原则  37
    4.1.2 垃圾邮件过滤评价  37-38
  4.2 垃圾邮件过滤的局限性  38-39
  4.3 目前常见的过滤器整合模型及其缺点  39-43
    4.3.1 简单级联模型  39-41
    4.3.2 陪审团机制模型  41-43
  4.4 总串分并过滤系统的提出  43-45
第5章 总串分并过滤系统  45-57
  5.1 总串分并  45-48
    5.1.1 总串分并系统的设计  45-46
    5.1.2 垃圾邮件与正常邮件的判定  46-48
  5.2 过滤系统关键技术  48-52
    5.2.1 多过滤器并发过滤  48-49
    5.2.2 Bayes算法的应用  49-52
  5.3 创新点分析  52
  5.4 过滤实验及性能分析  52-57
    5.4.1 语料介绍  52-53
    5.4.2 实验环境的搭建  53-54
    5.4.3 对比实验的设置  54-55
    5.4.4 实验及分析  55-57
第6章 结论与展望  57-59
  6.1 结论  57-58
  6.2 展望  58-59
致谢  59-60
参考文献  60-63
攻读学位期间的研究成果  63

相似论文

  1. 多传感器信息融合及其在可穿戴计算机上的应用,TP202
  2. 黄磷储罐区安全评价方法研究,TQ126.317
  3. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  4. 黑麦草(Lolium perenne L.)代谢QTL定位与代谢网络构建,S543.6
  5. 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
  6. 城市轨道交通运营管理系统测试与评价方法研究,TP311.52
  7. 类药性和生物利用度的理论预测研究,R914
  8. 基于贝叶斯理论的社会化标注主题聚类模型研究,C93
  9. FPSO在石油卸载过程中的风险评估,U698
  10. 基于鱼眼相机的运动物体检测和跟踪,TP391.41
  11. 有序Probit模型的非参贝叶斯统计,O212.8
  12. 基于状态空间模型的赔款准备金的研究,F842.3
  13. 基于压缩感知的认知无线电频谱检测技术及其研究,TN925
  14. 认知无线电系统合作频谱感知中感知数据错误化攻击防御技术,TN925
  15. 基于改进的非参数回归交通流量预测方法,F570
  16. 基于压缩感知的多径信道估计及其研究,TN925
  17. 基于双目立体视觉的水下三维重建,TP391.41
  18. 基于无线传感器网络的智能家居安全监测系统的研究与应用,TP273.5
  19. 重构算法在OFDM信道估计中的应用研究,TN919.3
  20. 基于最近邻及相似度测量检测钓鱼网页技术的研究,TP393.08
  21. 基于贝叶斯网络的软件风险管理模型研究与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 电子邮件(E-mail)
© 2012 www.xueweilunwen.com