学位论文 > 优秀研究生学位论文题录展示

基于群体智能的蚁群聚类算法及应用

作 者: 刘寿吉
导 师: 戴伟辉
学 校: 复旦大学
专 业: 信息管理与信息系统
关键词: 群体智能 聚类分析 优化蚁群算法 数据挖掘 可分类型数据
分类号: TP301.6
类 型: 硕士论文
年 份: 2008年
下 载: 324次
引 用: 4次
阅 读: 论文下载
 

内容摘要


群体智能起源于科学家对群体性昆虫行为的观察和研究。所谓群体智能是指众多无智能的简单个体组成群体,通过相互间的简单合作表现出智能行为的特性。群体智能以其分布性、简单性、自组织性以及健壮性在组合优化问题、知识发现、通信网络、数据挖据等研究领域显现出潜力和优势。将蚁群应用于聚类的灵感来源于对蚂蚁堆积他们的尸体和分类蚂蚁幼虫,经典的蚁群聚类算法利用蚁群具有的正反馈的特点,具有鲁棒性强、收敛性好、并行性,但也有算法收敛时间长、容易停滞,易于陷入局部最优的问题。文章提出了一种新的优化蚁群聚类算法。算法基于经典算法——LF算法,但引入了新的相似度度量公式和概率转换函数,采用了新的距离公式,使算法能够很好的处理可分类性数据。在传统蚁群算法基础上,引入了调整过程,对蚁群搬运过程形成的聚类进行迭代调整。理论证明了算法能够有效的形成聚类和收敛。实际数据实验说明了优化后的蚁群聚类算法能够形成比k-modes算法、基于信息熵的聚类算法、LF算法更为准确和稳定的聚类。可扩展性实验表明算法的运行时间和数据集大小存在比较明显的线性关系。进一步的,从过程和思路描述了一个利用优化蚁群聚类算法对移动公司客户进行分类的案例,并对聚类结果进行了分析。总之,与传统聚类算法相比,优化蚁群聚类算法能够快速、准确、有效的处理大型可分类数据集,同时保持良好的可扩展性。

全文目录


目录  2-4
摘要  4-5
ABSTRACT  5-6
第一章 导论  6-9
  1.1 选题背景与研究意义  6
  1.2 研究内容与贡献  6-8
  1.3 文章组织结构  8-9
第二章 文献综述  9-26
  2.1 群体智能研究  9-11
    2.1.1 群体智能定义  9-10
    2.1.2 群体智能特点  10-11
    2.1.3 群体智能算法  11
  2.2 聚类分析研究  11-17
    2.2.1 聚类分析定义  11-12
    2.2.2 聚类分析的数据表示  12-14
    2.2.3 主要聚类算法  14-15
    2.2.4 K-means算法和k-modes算法  15-17
  2.3 蚁群聚类算法研究  17-25
    2.3.1 基本模型  17-18
    2.3.2 LF算法  18-20
    2.3.3 基于信息熵的蚁群聚类算法  20-21
    2.3.4 多蚁群聚类组合算法  21-24
    2.3.5 K均值混合聚类算法  24-25
  2.4 本章小结  25-26
第三章 基于群体智能的优化蚁群聚类算法  26-38
  3.1 定义  26-28
  3.2 数学模型基础  28-32
    3.2.1 数学模型  28
    3.2.2 最优解特征  28-29
    3.2.3 算法收敛性讨论  29-32
  3.3 算法过程  32-35
    3.3.1 搬运过程  32-33
    3.3.2 调整过程  33-34
    3.3.3 主要改进  34-35
  3.4 算法描述  35-37
    3.4.1 流程图描述  35-36
    3.4.2 算法伪代码  36-37
  3.5 本章小结  37-38
第四章 聚类数据实验  38-50
  4.1 数据集  38-39
  4.2 聚类效果度量  39-40
  4.3 实验结果  40-46
    4.3.1 Car数据集实验  40-41
    4.3.2 Soybean数据集实验  41-42
    4.3.3 Voting数据集实验  42-44
    4.3.4 Zoo数据集实验  44-46
  4.4 结果分析  46-48
  4.5 扩展性实验  48-49
  4.6 本章小结  49-50
第五章 蚁群聚类算法的应用  50-58
  5.1 案例背景和目标  50
  5.2 数据预处理  50-52
  5.3 聚类分析  52-55
  5.4 结果讨论  55-56
  5.5 本章小结  56-58
第六章 结论与展望  58-60
  6.1 研究成果与意义  58
  6.2 未来研究方向  58-60
参考文献  60-62
攻读硕士学位期间发表的论文  62
攻读硕士学位期间参与的主要科研项目  62-63
致谢  63-64

相似论文

  1. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  2. 高血压前期证候特征研究,R259
  3. 基于数据挖掘技术的保健品营销研究,F426.72
  4. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  5. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  6. 大学生综合素质测评研究,G645.5
  7. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  8. 21个荷花品种遗传多样性的ISSR分析,S682.32
  9. 改进的蚁群算法及其在TSP上的应用研究,TP301.6
  10. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  11. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  12. 南通市农业面源污染负荷研究与综合评价,X592
  13. 土壤环境功能区划研究,X321
  14. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  15. 大豆杂种优势及其遗传基础研究,S565.1
  16. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  17. Bicluster数据分析软件设计与实现,TP311.52
  18. 基于变异粒子群的聚类算法研究,TP18
  19. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  20. 基于遗传算法和粗糙集的聚类算法研究,TP18
  21. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com