学位论文 > 优秀研究生学位论文题录展示
基于数据挖掘的智能信息过滤系统的设计与实现
作 者: 党红云
导 师: 蒋品群
学 校: 广西师范大学
专 业: 电路与系统
关键词: 信息过滤 数据挖掘 网络接口 模式匹配
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 83次
引 用: 0次
阅 读: 论文下载
内容摘要
在互联网时代,人们一方面在充分享受信息共享所带来的便利的同时,另一方面也不可避免地受到色情、暴力、反动等不良信息的困扰。在浩瀚的数据海洋里,人们怎样才能吸取精华、去其糟粕,已经成为互联网时代人们关注的重大问题。智能信息过滤系统也是黑客监控系统不可或缺的一部分,在黑客监控系统中加入智能信息过滤系统以及黑客监控技术,能使网络监控更加多方位与完整。因此,本课题具有较大的实际意义和应用前景。本论文首先介绍了课题的研究背景及意义,国内外信息过滤技术的发展历程、研究现状、关键算法、核心技术,分析了一些典型信息过滤模型的优缺点;然后在充分调研的基础上,基于数据挖掘技术,设计并实现了一个智能过滤系统;最后对论文的工作进行了总结和展望。主要完成了如下3项工作:(1)样本信息库的构建对于一个信息过滤系统,首要的任务是构建一个信息完整、数据准确、运行可靠的样本信息库。因此,本论文采用端口过滤、网址过滤和内容过滤相结合的混合过滤方式,自动组织样本库,自动分类,大大减轻了构建信息过滤系统的工作量,提高了信息过滤系统的运行效率。(2)网页文本归类优化信息过滤的最终目的是根据源信息与样本信息的比较结果,确定是否过滤源信息。因此,对网页文本进行归类优化,对比网页信息与样本信息的来源,是信息过滤系统的核心任务之一。我们在分析常用的KMP模式匹配算法优缺点的基础上,对其进行了改进。改进的算法能够跳过尽可能多的字符进行匹配,减少了循环次数,提高了信息过滤与网络监控系统的运行效率。(3)基于数据挖掘的智能信息过滤系统的设计与实现以数据挖掘技术为基础,设计并实现了一个智能信息过滤系统。实验结果表明,本系统能够根据用户的策略、指定的过滤范围进行正确、可靠、高效的信息过滤。综上所述,本信息过滤系统结构合理、操作简便、运行效率高、可维护性好,具有较大的应用价值。
|
全文目录
摘要 3-4 Abstract 4-8 第一章 绪论 8-11 1.1 选题的背景及研究意义 8 1.2 国内外信息过滤技术的研究现状与发展趋势 8-10 1.2.1 国内外信息过滤系统的研究现状 8-9 1.2.2 信息过滤系统的发展趋势 9-10 1.3 论文的研究内容及组织结构 10-11 第二章 基于数据挖掘的信息过滤技术 11-23 2.1 构建信息过滤系统要求 11-16 2.1.1 信息过滤系统需要满足的协议规范 11 2.1.2 信息过滤系统的标准化分类 11-15 2.1.3 信息过滤中存在的问题 15-16 2.2 网络信息过滤中需要解决的核心问题 16-20 2.2.1 基于winsocket套接字的过滤 16 2.2.2 基于应用层接口编程的网址过滤 16-17 2.2.3 信息过滤系统的模型分类 17-20 2.3 数据挖掘与信息过滤技术的融合与应用 20-22 2.3.1 数据挖掘的关键技术和分析方法 20-21 2.3.2 样本信息库的构建 21-22 2.4 本章小结 22-23 第三章 改进的KMP算法在不良网站信息过滤中的应用 23-28 3.1 模式匹配算法概述 23-25 3.1.1 KMP算法及改进策略 23-25 3.1.2 KMP算法在系统中的应用与功能要求 25 3.2 KMP算法在系统中的结构和设计 25-27 3.2.1 整体结构设计 25-26 3.2.2 系统界面设计 26-27 3.3 本章小结 27-28 第四章 网页分类的设计 28-33 4.1 网页分类的总体概述 28 4.1.1 网页分类的背景 28 4.1.2 网页分类的设计 28 4.2 数据的接口和存储 28-29 4.2.1 API设计 28-29 4.2.2 TAIR设计 29 4.3 网页分类的详细设计 29-32 4.3.1 设计的主要流程图 29-31 4.3.2 各模块的服务架构 31 4.3.3 特征选取和分类模型两个重要模块的设计 31-32 4.4 本章小结 32-33 第五章 构建主题丰富、分层清晰的信息过滤系统 33-45 5.1 主题丰富、分层清晰的智能监听过滤策略 33-37 5.1.1 系统总体设计思想 33-35 5.1.2 设计的主要内容 35-37 5.2 信息过滤系统的具体实现步骤 37-42 5.2.1 关键模块 37-38 5.2.2 系统运行流程 38-39 5.2.3 系统实现 39-40 5.2.4 主要界面 40-42 5.3 运行结果及分析 42-44 5.4 本章小结 44-45 第六章 总结与展望 45-47 6.1 论文的主要工作 45 6.2 下一步的研究方向 45-47 参考文献 47-52 攻读硕士期间的发表的论 52-53 致谢 53-54
|
相似论文
- FPGA/DSP图像协处理技术及以太网数据传输,TP391.41
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于行业参数优化模型的投资项目决策支持系统,F283
- 基于查询接口的Deep Web模式匹配方法研究,TP311.13
- 数据集市在电信经营分析中的应用研究,TP311.13
- 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
- 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
- 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 关联规则挖掘在交通事故成因分析中的应用,U491.31
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|