学位论文 > 优秀研究生学位论文题录展示
基于人工免疫的中文反垃圾邮件系统的研究与实现
作 者: 黄珏
导 师: 陈兵
学 校: 南京航空航天大学
专 业: 计算机应用技术
关键词: 垃圾邮件 邮件解码 人工免疫 中文分词 特征提取 反馈学习
分类号: TP393.098
类 型: 硕士论文
年 份: 2009年
下 载: 27次
引 用: 0次
阅 读: 论文下载
内容摘要
随着电子邮件越来越普及的使用,电子邮件已经是人们日常生活网络交流的重要途径。然而垃圾邮件作为商业广告、病毒程序或敏感内容的载体,占用信箱空间和网络带宽,威胁系统安全,给人们的生活带来诸多不便。反垃圾邮件问题已成为全球性的具有重大现实意义的课题。针对中文垃圾邮件具有动态性、变异性等特点,论文在邮件安全系统中引入人工免疫思想,设计并实现了一种基于人工免疫的中文反垃圾邮件过滤系统。论文首先研究了垃圾邮件内容过滤的相关技术,通过与以往邮件过滤技术优缺点的对比分析,指出基于人工免疫的邮件过滤在动态性、自适应、自学习等方面具有突出优势;其次具体介绍了人工免疫系统的基本概念、人工免疫系统的仿生原理及人工免疫算法的基本流程,分析了将人工免疫系统运用于中文垃圾邮件处理的可行性;再次,针对AISEC(an Artificial Immune System for E-mail Classification)算法基因库和自体库生成效率不高的问题进行改进,提出了基于权重的自体库和基因库生成算法,实验结果表明,改进后的算法减少了算法耗时,提高了分类效率;最后设计了基于人工免疫的垃圾邮件系统模型CECBAI(Chinese-Email Classification Based on Artificial Immunity),给出了系统中各关键模块的工作流程,并通过实验分析了系统中关键参数的设定对中文垃圾邮件过滤性能的影响。与传统的Bayes算法过滤效果相比,基于人工免疫的垃圾邮件过滤机制在动态性和自适应性方面具有较大优势。
|
全文目录
摘要 4-5 ABSTRACT 5-11 第一章 绪论 11-15 1.1 课题研究背景 11-12 1.2 国内外研究现状 12-13 1.3 本文研究内容 13-14 1.4 本文结构 14-15 第二章 基于人工免疫的垃圾邮件过滤技术 15-29 2.1 垃圾邮件过滤技术介绍 15-21 2.1.1 基于规则的垃圾邮件过滤技术 16-17 2.1.2 基于统计的垃圾邮件过滤技术 17-19 2.1.3 垃圾邮件过滤新技术 19-21 2.2 人工免疫技术相关知识 21-27 2.2.1 人工免疫系统产生和发展 21-22 2.2.2 人工免疫系统相关概念 22 2.2.3 人工免疫系统仿生机理 22-25 2.2.4 人工免疫基本流程和算法 25-27 2.3 小结 27-29 第三章 基于人工免疫的中文垃圾邮件过滤算法的改进 29-35 3.1 AISEC 算法 29-30 3.2 自体库生成算法改进和更新策略 30-32 3.2.1 自体库生成算法改进 30-31 3.2.2 自体库更新策略 31-32 3.3 基因库生成算法的改进和更新策略 32-33 3.4 实验和结果分析 33-34 3.4.1 实验样本集 33 3.4.2 实验结果和分析 33-34 3.5 小结 34-35 第四章 基于人工免疫的中文反垃圾邮件系统设计与实现 35-63 4.1 CECBAI 系统的总体结构 35-39 4.1.1 总体设计 36 4.1.2 各模块流程图 36-37 4.1.3 相关概念说明 37-39 4.2 邮件预处理模块 39-43 4.2.1 邮件解码器 39-40 4.2.2 中文分词 40-42 4.2.3 提取特征词 42 4.2.4 邮件向量化 42-43 4.3 检测器耐受训练模块 43-47 4.3.1 基因库和自体库的形成 43-46 4.3.2 检测器的生命周期 46-47 4.4 邮件检测模块 47-51 4.5 反馈模块 51-57 4.5.1 增量学习和重新学习 51-52 4.5.2 反馈模块设计 52-57 4.6 实验分析和验证 57-62 4.6.1 评价标准 57-58 4.6.2 系统关键参数选取对于系统过滤效果的影响 58-59 4.6.3 与Bayes 系统比较分析 59-62 4.7 小结 62-63 第五章 总结和展望 63-65 5.1 论文的主要工作 63 5.2 下一步工作和展望 63-65 参考文献 65-70 致谢 70-71 在学期间的研究成果及发表的论文 71
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 人工免疫分类和异常识别算法的改进,R392.1
- 红外图像目标识别及跟踪技术研究,TP391.41
- 水下目标特征的压缩与融合技术研究,TN911.7
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 电子邮件(E-mail)
© 2012 www.xueweilunwen.com
|