学位论文 > 优秀研究生学位论文题录展示

谱聚类在离群数据挖掘中的应用研究

作 者: 钟洵
导 师: 朱庆生
学 校: 重庆大学
专 业: 计算机软件与理论
关键词: 离群数据挖掘 谱聚类 NJW
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 141次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着数据库技术的不断发展和Internet的不段完善,人们利用信息技术得到数据和潜在知识的能力得到极大的提高,数据挖掘正是在这种时代背景下产生的,其实质是从存放在数据库,数据仓库或其他信息库中的大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。离群数据是指远离常规数据对象的数据,不满足数据的一般模式和行为,这类数据与常规数据之间存在着明显的差异,因此我们有理由怀疑他们是由另一种完全不同的机制产生的,因此,作为数据挖掘的重要分支,离群数据挖掘已被广泛应用到医疗分析,网络入侵检测,金融客户分析,移动通信检测等多个方面。目前,离群数据挖掘已成为机器学习、数据库等领域专家学者的研究热点。离群数据挖掘分为发现离群数据和离群数据分析两个阶段,第一个阶段主要应用一些具体的离群数据挖掘算法寻找离群数据,第二个阶段主要结合数据本身性质和相关算法对挖掘出的离群数据进行分析,获取知识。本文重点讨论该过程的第一个阶段——离群数据发现。谱聚类由于能在任意形状的数据样本上进行聚类,逐步成为了当今聚类领域的研究热点。本文通过对离群数据挖掘实际应用的分析,成功地将谱聚类算法应用到离群数据挖掘领域,提出了基于NJW的离群数据挖掘算法,并通过实验验证了算法的有效性。总的说来,本文主要着眼于以下几个方面进行研究:①结合当今数据挖掘和离群数据挖掘领域的发展现状及趋势,分析了两者之间的关系,并分别给出了相应的挖掘流程。②具体介绍了当今离群数据挖掘的各种算法,对常用的离群数据挖掘算法的优点、缺点以及适用性进行了详细对比。③着重介绍了谱聚类的相关理论,并对其优势进行了具体地分析。④提出谱聚类应用于离群数据挖掘的具体问题,给出解决办法,成功将谱聚类的NJW算法应用于离群数据挖掘领域。通过对人工数据集和真实数据集的实验,验证了算法的有效性。⑤提出了后续研究工作的主要方向,并对离群数据挖掘的未来发展进行了展望。本文提出的基于NJW的离群数据挖掘算法具有一定的理论基础和实用价值,实验证明,该算法的效果令人满意。

全文目录


中文摘要  3-4
英文摘要  4-7
1 绪论  7-9
  1.1 研究背景和意义  7
  1.2 国内外研究现状  7-8
  1.3 本文研究主要内容及结构  8-9
2 离群数据挖掘相关基础  9-18
  2.1 数据挖掘概述  9-13
    2.1.1 数据挖掘定义  9-10
    2.1.2 数据挖掘流程  10-12
    2.1.3 数据挖掘与相关学科  12-13
  2.2 离群数据挖掘概述  13-17
    2.2.1 离群数据挖掘定义  13-14
    2.2.2 离群数据挖掘相关发展  14-16
    2.2.3 离群数据挖掘主要流程  16-17
  2.3 本章小结  17-18
3 离群数据挖掘算法概述  18-30
  3.1 基于统计的离群数据挖掘算法  19-20
  3.2 基于深度的离群数据挖掘算法  20-21
  3.3 基于距离的离群数据挖掘算法  21-23
  3.4 基于密度的离群数据挖掘算法  23-24
  3.5 基于规则的离群数据挖掘算法  24-25
  3.6 基于偏移的离群数据挖掘算法  25-26
  3.7 基于聚类的离群数据挖掘算法  26-27
  3.8 其他离群数据挖掘方法  27-28
  3.9 主要离群数据挖掘方法之间的比较  28-29
  3.10 离群数据分析  29
  3.11 本章小结  29-30
4 谱聚类  30-40
  4.1 谱图理论  30-34
    4.1.1 图划分理论  30
    4.1.2 谱图理论  30-34
  4.2 谱聚类  34-39
    4.2.1 谱聚类概述  34-35
    4.2.2 谱聚类算法  35-37
    4.2.3 谱聚类与其他聚类算法对比  37-39
  4.3 本章小结  39-40
5 谱聚类在离群数据挖掘中的应用  40-52
  5.1 谱聚类应用于离群数据挖掘的可行性分析  40-42
    5.1.1 问题描述  40-41
    5.1.2 带有离群点数据集的谱系特征分析  41-42
  5.2 基于谱聚类的离群数据挖掘算法  42-45
    5.2.1 谱聚类算法选取  42-43
    5.2.2 离群指数  43-44
    5.2.3 基于NJW 的离群数据挖掘算法  44-45
  5.3 算法性能测试  45-51
    5.3.1 人工数据集  45-48
    5.3.2 真实数据集  48-51
  5.4 本章小结  51-52
6 论文总结  52-54
  6.1 论文主要工作  52-53
  6.2 后续展望  53-54
致谢  54-55
参考文献  55-58
附录  58
  A. 作者在攻读硕士学位期间发表的论文  58
  B. 作者在攻读硕士学位期间参加的科研项目  58

相似论文

  1. 基于图分割的文本提取方法研究,TP391.41
  2. 基于谱聚类的无监督图像分割,TP391.41
  3. 烟草样品中微量金属元素含量测定及模式识别研究,TS47
  4. 改进的谱聚类图像分割方法研究,TP391.41
  5. 基于分形理论的中国股市预警机制研究,F832.51
  6. 基于数据挖掘技术的网络社区发现方法的研究与实现,TP393.094
  7. 基于组群挖掘的服务发现推荐方法,TP393.09
  8. 基于粗糙集的图书销售信息离群数据检测,TP311.13
  9. 联机分析挖掘技术及其应用研究,TP311.13
  10. 高维数据集中离群数据挖掘方法的研究,TP311.13
  11. 基于关联规则的离群挖掘的研究,TP311.13
  12. 城市燃气负荷预测的研究,TU996.3
  13. 移动Ad Hoc网络入侵检测与安全路由关键技术研究,TN929.5
  14. 时序多文档文摘相关技术研究,TP391.1
  15. 基于多线索融合的互联网图像搜索引擎关键技术研究,TP391.3
  16. 图像谱方法分割的研究及应用,TP391.41
  17. 数据挖掘技术中聚类算法的研究,TP311.13
  18. 基于半监督学习和区域特性的图像分割算法研究,TP391.41
  19. 基于规范切和分水岭的聚类算法研究,TP181
  20. 基于BIRCH和GAD的谱聚类算法研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com