学位论文 > 优秀研究生学位论文题录展示

演化聚类算法及其应用研究

作 者: 杨宝迪
导 师: 董红斌
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 演化算法 模糊聚类 模糊C均值算法 异质协同演化算法 文本聚类
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 41次
引 用: 0次
阅 读: 论文下载
 

内容摘要


模糊C均值算法(FCM)是当前比较流行且应用广泛的一种模糊聚类算法,已经成功应用于模式识别、图像处理等诸多领域。但是,它存在着需要聚类数目先验知识、对初始值敏感和易陷入局部极值等固有的缺点。为了弥补FCM算法的缺点,同时鉴于演化算法作为一种随机全局搜索技术的卓越优化效果,本文将遗传算法与差异演化算法相结合,提出一种异质协同演化模糊聚类算法——GADEFCM算法。该算法使用改进的掩码方式动态决定聚类中心的数目,将种群划分成两个子种群,分别用遗传算法和差异演化算法进行演化,子种群中的每个个体按规则执行FCM操作进一步加快算法收敛速度。在演化过程中两个子种群相互协作,通过不同的间隔迁移策略相互交换优良个体引导搜索过程,充分利用了遗传算法的全局探索能力与差异演化算法的局部搜索能力。GADEFCM算法克服了FCM算法需要聚类数目先验知识和易陷入局部极值等缺点,能够更高效的找到全局最优解。本文通过MATLAB平台进行仿真实验,使用数据集对GADEFCM算法和其它几种算法的聚类效果、聚类数目和运行时间进行测试,实验结果证明了该算法能够在运行时间允许的前提下,找到正确的聚类中心数目,获得更好的聚类效果。最后,将GADEFCM算法应用于文本聚类,通过实验证明了该算法能够获得较好的文本聚类效果。

全文目录


摘要  5-6
Abstract  6-9
第1章 绪论  9-14
  1.1 课题研究背景及意义  9-10
  1.2 国内外研究现状  10-12
    1.2.1 演化算法研究现状  10-12
    1.2.2 模糊聚类算法研究现状  12
  1.3 本文的主要工作及内容安排  12-14
第2章 演化算法及模糊聚类分析  14-24
  2.1 差异演化算法  14-17
    2.1.1 差异演化算法基本思想  14-15
    2.1.2 差异演化算法基本流程  15
    2.1.3 差异演化算法变异策略  15-17
  2.2 协同演化算法  17-20
    2.2.1 协同演化算法基本思想  17-19
    2.2.2 协同演化算法分类情况  19-20
  2.3 模糊聚类算法  20-23
    2.3.1 模糊C均值聚类算法  20-21
    2.3.2 模糊聚类有效性指标  21-23
  2.4 本章小结  23-24
第3章 异质协同演化模糊聚类算法  24-43
  3.1 混合变异策略的差异演化算法  24-30
    3.1.1 混合变异策略的差异演化算法的基本思想  24-26
    3.1.2 混合变异策略的差异演化算法的基本流程  26-27
    3.1.3 实验结果与分析  27-30
  3.2 异质协同演化模糊聚类算法  30-37
    3.2.1 异质协同演化模糊聚类算法的基本思想  30-33
    3.2.2 个体编码方式和种群初始化  33-34
    3.2.3 异质协同演化模糊聚类算法的基本流程  34-37
  3.3 实验结果与分析  37-42
    3.3.1 聚类效果比较  37-40
    3.3.2 聚类数目比较  40-41
    3.3.3 运行时间比较  41-42
  3.4 本章小结  42-43
第4章 异质协同演化模糊聚类算法在文本聚类中的应用  43-52
  4.1 文本的表示  43-46
    4.1.1 向量空间模型  43-44
    4.1.2 TF-IDF权值计算  44-45
    4.1.3 文本相似性度量  45-46
  4.2 文本特征选择  46-48
  4.3 文本聚类实验  48-51
    4.3.1 数据源  48
    4.3.2 文本预处理  48
    4.3.3 聚类评价指标  48-49
    4.3.4 实验结果与分析  49-51
  4.4 本章小结  51-52
结论  52-53
参考文献  53-57
攻读硕士学位期间发表的论文和取得的科研成果  57-58
致谢  58-59
附录  59-60

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 土壤环境功能区划研究,X321
  3. 基于本体的食品投诉文档文本聚类研究,TP391.1
  4. 面向短消息文本的聚类技术研究与应用,TP391.1
  5. 教育新闻热点话题发现系统的设计与实现,TP391.1
  6. 电力系统电压无功控制方法研究,TM761.1
  7. 停车诱导在智能移动终端上的设计与实现,TN929.53
  8. Web新闻热点发现系统的设计与实现,TP393.09
  9. 面向海量数据的云存储系统实现与应用研究,TP333
  10. 基于物流港口企业业务流程战略转型的岗位优化设置研究,F259.27;F224
  11. 面向学科的文献资源聚类系统研究及应用,TP391.1
  12. 基于粗糙集理论的图像分割研究,TP391.41
  13. 分布式企业协同分销系统研究及应用,F224
  14. 长大客运专线客运量调查与预测研究,F224;U293.13
  15. 基于支持向量机的能源管理系统短期负荷预测,TM715
  16. 基于质量检验原理的CAPP技术的应用研究,TP391.7
  17. 辣椒制品表观辣度的模糊评价方法的研究,S641.3
  18. 基于WEB日志挖掘的用户兴趣模式研究,TP393.092
  19. SOM算法的改进及其在中文文本聚类的应用,TP391.1
  20. 视频镜头边界检测算法的研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com