学位论文 > 优秀研究生学位论文题录展示

基于粒子群和粗糙集的聚类算法研究

作 者: 姚丽娟
导 师: 罗可
学 校: 长沙理工大学
专 业: 计算机应用技术
关键词: 数据挖掘 K-medoids算法 粒子群算法 粗糙集 核函数
分类号: TP18
类 型: 硕士论文
年 份: 2012年
下 载: 82次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据挖掘就是从海量数据中提取具有潜在价值的信息,是目前信息管理领域和数据库技术最前沿的研究方向之一。聚类分析作为数据挖掘技术中的重要组成部分,已经广泛应用于模式识别、图像处理、数据压缩及市场营销等许多领域。本文深入探讨了K-medoids聚类算法、粒子群算法核函数以及粗糙集理论,主要研究工作如下:(1)针对K-medoids算法存在初始聚类中心敏感、聚类精度较低及收敛速度缓慢的缺点,提出一种基于密度初始化、密度迭代的搜索策略和准则函数优化的方法。实验表明,该算法能充分利用密度初始化思想,并将中心点的候选范围缩小使得聚类收敛时间大幅度减少,加权准则函数进一步保证了聚类的高效性。(2)深入分析K-medoids算法还存在易陷入局部最优的缺点,提出一种基于粒子群的聚类算法。通过寻找粒子群和K-medoids算法的契合度,利用粒子群的全局寻优能力防止算法陷入局部最优。实验表明,与其他算法相比,该算法具有更高的正确率,时间复杂度更低,综合性能更稳定。(3)提出一种基于粒子群的粗糙核聚类算法,该算法将K-medoids和粗糙集、核函数及粒子群算法进行有效结合,克服了K-medoids不能处理非线性数据和边界对象的缺点。该算法通过Mercer核将样本映射到高维空间,使样本变得线性可分;并结合粗糙集思想,对边界对象进行处理;同时采用ReliefF方法对样本属性进行加权处理,最后利用粒子群算法防止算法陷入局部最优。实验证明,该算法能对高维线性不可分数据具有较好的聚类效果,并证明了算法的正确性和高效性。

全文目录


摘要  5-6
ABSTRACT  6-9
第一章 绪论  9-16
  1.1 研究背景和意义  9
  1.2 数据挖掘的理论和应用  9-14
    1.2.1 数据挖掘的发展背景  9-10
    1.2.2 数据挖掘的研究现状  10-13
    1.2.3 聚类技术的研究现状  13-14
  1.3 本文的主要工作  14
  1.4 论文的组织结构  14-16
第二章 相关知识  16-27
  2.1 聚类分析  16-19
    2.1.1 基本概念及描述  16
    2.1.2 主要算法及比较  16-19
  2.2 粗糙集理论  19-21
    2.2.1 不可分辨关系  19-20
    2.2.2 集合的上、下近似集  20-21
    2.2.3 粗糙集的基本性质  21
  2.3 核函数  21-23
    2.3.1 基本原理  21-22
    2.3.2 基本理论知识  22-23
    2.3.3 核函数方法的特点  23
  2.4 粒子群算法  23-25
    2.4.1 基本原理  23-25
    2.4.2 处理流程  25
    2.4.3 与其他算法的比较  25
  2.5 ReliefF 加权算法  25-26
  2.6 本章小结  26-27
第三章 自适应 K-medoids 聚类算法  27-36
  3.1 问题提出  27
  3.2 自适应 K-medoids 思想  27-29
    3.2.1 密度初始化  27-28
    3.2.2 基于密度的迭代搜索策略  28-29
    3.2.3 优化准则函数  29
  3.3 自适应 K-medoids 算法  29-31
    3.3.1 算法描述  29-30
    3.3.2 算法分析  30-31
  3.4 实验仿真及结果分析  31-35
    3.4.1 实验设计  31-32
    3.4.2 实验结果分析  32-35
  3.5 本章小结  35-36
第四章 基于粒子群的 K-medoids 算法  36-42
  4.1 问题提出  36
  4.2 基于粒子群的 K-medoids 算法思想  36-37
  4.3 基于粒子群的 K-medoids 算法  37-39
    4.3.1 粒子群初始化  37
    4.3.2 聚类中心优化  37-38
    4.3.3 适应度函数  38
    4.3.4 算法编码  38
    4.3.5 算法流程  38-39
  4.4 实验仿真及结果分析  39-41
    4.4.1 实验设计  39
    4.4.2 实验结果分析  39-41
  4.5 本章小结  41-42
第五章 基于粒子群的粗糙核聚类算法  42-50
  5.1 问题提出  42
  5.2 基于粒子群的粗糙核聚类算法  42-46
    5.2.1 属性加权操作  42
    5.2.2 权值的动态调整  42-43
    5.2.3 聚类边界与聚类中心的计算  43
    5.2.4 算法收敛准则  43-44
    5.2.5 适应度函数  44
    5.2.6 算法流程  44-46
  5.3 实验仿真及结果分析  46-48
    5.3.1 实验设计  46-47
    5.3.2 实验结果分析  47-48
  5.4 本章小结  48-50
第六章 总结与展望  50-52
  6.1 工作总结  50
  6.2 未来工作及展望  50-52
参考文献  52-60
致谢  60-61
附录 A 攻读学位期间所发表的学术论文  61-62
摘要  62-66
ABSTRACT  66-70

相似论文

  1. 地波辐射源的调制类型识别与参数估计,TN957.51
  2. 基于图像的路面破损识别,TP391.41
  3. 基于支持向量机的故障诊断方法研究,TP18
  4. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  5. 基于数据挖掘技术的保健品营销研究,F426.72
  6. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  7. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  8. 有源电力滤波器及其在配电网中的应用,TN713.8
  9. 基于连锁图的QTL综合分析方法研究,S562
  10. Bicluster数据分析软件设计与实现,TP311.52
  11. 基于变异粒子群的聚类算法研究,TP18
  12. 基于遗传算法和粗糙集的聚类算法研究,TP18
  13. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  14. 基于粒子群的分子对接算法,R91
  15. 基于特征选择的入侵检测研究,TP393.08
  16. LS-SVM算法预测煤层瓦斯涌出量技术研究及应用,TD712.5
  17. 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
  18. 粗糙集的增量式属性约简研究,TP18
  19. 知识粒度的计算及其在属性约简中的应用研究,TP18
  20. 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
  21. 基于改进粒子群算法的无功优化,TP301.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com