学位论文 > 优秀研究生学位论文题录展示

基于距离和信息熵的不确定异常点检测研究

作 者: 杨金伟
导 师: 王丽珍
学 校: 云南大学
专 业: 计算机系统结构
关键词: 不确定数据 异常点检测 剪枝
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 103次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,数据收集与处理技术导致了大量的数据不一致和丢失,这样的数据通常是以不确定的形式出现。不确定数据的出现对传统的数据挖掘技术提出了新的挑战。作为数据挖掘的一项重要任务,异常点检测越来越引起研究人员的重视。但是,在传统的异常点检测算法中,数据多是确定的,或是没考虑数据的自然结构,导致检测出的异常点与实际有较大出入。因此,在不确定数据集上进行异常点检测有很重要的意义。本文就选择了从不确定数据集中检测异常点这一课题进行研究。首先,介绍了异常点检测的相关概念和形成原因,以及几种传统的异常点检测方法,接着介绍了不确定数据的管理,以及几种常用的处理不确定性的数学理论,并对连续数值型不确定数据作了简要陈述。其次,把传统的基于距离的异常点检测方法扩展到不确定连续数据上,定义了不确定数据异常点检测的相关概念,并设计了一个基于距离的不确定数据异常点检测的算法。再次,针对所提出算法时间复杂度高的问题,提出了一种基于信息熵的剪枝策略,用实例说明了剪枝策略的合理性,并对剪枝策略的时间复杂性进行了分析。第四,通过模拟数据的实验,验证了参数变化对剪枝算法的影响,并基于真实数据与原算法对比,检验了剪枝算法的效率和效果。

全文目录


相似论文

  1. 基于不确定数据的轮廓查询处理技术研究,TP311.13
  2. 同行评议专家反评估模型的研究,TP182
  3. 基于孤立系数的孤立点检测研究,TP311.13
  4. 基于剪枝策略的中国象棋搜索引擎研究,TP391.3
  5. 五子棋人机对战系统设计,TP18
  6. 基于局势变化的计算机中国象棋研究,TP18
  7. 决策树算法在临床诊断中的应用研究,TP311.13
  8. 基于决策树中文文本分类技术的研究与实现,TP391.1
  9. 模糊决策树剪枝研究,TP18
  10. 分支合并对决策树归纳学习的影响,TP311.13
  11. 服务组合中的资源与行为整合方法,F270.7
  12. 数据挖掘技术在教学评价系统中的应用研究,TP311.52
  13. 基于离群点挖掘的RFID冷链实时温控研究,TP391.44
  14. 一种基于动态排序的最大频繁项集挖掘算法,TP311.13
  15. 保持图像骨架连续的剪枝技术及相关问题研究,TP391.41
  16. 概念格分布式构造算法研究,O153.1
  17. 城市园林植物废弃枝叶分解利用研究,S141.4
  18. 基于DIV标签树的网页主题信息抽取方法,TP393.092
  19. 求解带弱约束条件的约束优化问题的文化算法研究,TP301.6
  20. 空间数据库中基于R-树的最近邻查询方法研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com