学位论文 > 优秀研究生学位论文题录展示
基于距离和信息熵的不确定异常点检测研究
作 者: 杨金伟
导 师: 王丽珍
学 校: 云南大学
专 业: 计算机系统结构
关键词: 不确定数据 异常点检测 剪枝
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 103次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,数据收集与处理技术导致了大量的数据不一致和丢失,这样的数据通常是以不确定的形式出现。不确定数据的出现对传统的数据挖掘技术提出了新的挑战。作为数据挖掘的一项重要任务,异常点检测越来越引起研究人员的重视。但是,在传统的异常点检测算法中,数据多是确定的,或是没考虑数据的自然结构,导致检测出的异常点与实际有较大出入。因此,在不确定数据集上进行异常点检测有很重要的意义。本文就选择了从不确定数据集中检测异常点这一课题进行研究。首先,介绍了异常点检测的相关概念和形成原因,以及几种传统的异常点检测方法,接着介绍了不确定数据的管理,以及几种常用的处理不确定性的数学理论,并对连续数值型不确定数据作了简要陈述。其次,把传统的基于距离的异常点检测方法扩展到不确定连续数据上,定义了不确定数据异常点检测的相关概念,并设计了一个基于距离的不确定数据异常点检测的算法。再次,针对所提出算法时间复杂度高的问题,提出了一种基于信息熵的剪枝策略,用实例说明了剪枝策略的合理性,并对剪枝策略的时间复杂性进行了分析。第四,通过模拟数据的实验,验证了参数变化对剪枝算法的影响,并基于真实数据与原算法对比,检验了剪枝算法的效率和效果。
|
全文目录
相似论文
- 基于不确定数据的轮廓查询处理技术研究,TP311.13
- 同行评议专家反评估模型的研究,TP182
- 基于孤立系数的孤立点检测研究,TP311.13
- 基于剪枝策略的中国象棋搜索引擎研究,TP391.3
- 五子棋人机对战系统设计,TP18
- 基于局势变化的计算机中国象棋研究,TP18
- 决策树算法在临床诊断中的应用研究,TP311.13
- 基于决策树中文文本分类技术的研究与实现,TP391.1
- 模糊决策树剪枝研究,TP18
- 分支合并对决策树归纳学习的影响,TP311.13
- 服务组合中的资源与行为整合方法,F270.7
- 数据挖掘技术在教学评价系统中的应用研究,TP311.52
- 基于离群点挖掘的RFID冷链实时温控研究,TP391.44
- 一种基于动态排序的最大频繁项集挖掘算法,TP311.13
- 保持图像骨架连续的剪枝技术及相关问题研究,TP391.41
- 概念格分布式构造算法研究,O153.1
- 城市园林植物废弃枝叶分解利用研究,S141.4
- 基于DIV标签树的网页主题信息抽取方法,TP393.092
- 求解带弱约束条件的约束优化问题的文化算法研究,TP301.6
- 空间数据库中基于R-树的最近邻查询方法研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|