学位论文 > 优秀研究生学位论文题录展示

基于强化学习的蚁群聚类研究及应用

作 者: 陈浩
导 师: 刘全
学 校: 苏州大学
专 业: 计算机软件和理论
关键词: 蚁群优化 强化学习 聚类分析 动态挥发率 变异策略
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 22次
引 用: 0次
阅 读: 论文下载
 

内容摘要


蚁群算法是利用群体智能解决实际问题的一个典型实例。20世纪90年代由意大利的Dorigo等学者提出,是继遗传算法、模拟退火、神经网络之后的一种新的元启发式搜索算法。自提出以来,在分布式控制、智能优化、数据挖掘等方面得到了广泛的应用。尽管如此,蚁群算法在理论和应用方法上还有很多亟待完善之处,如易于陷入停滞、收敛速度慢等问题。针对蚁群算法存在的易于停滞、收敛速度慢等问题,本文从蚁群优化在TSP问题中的应用角度出发,提出了相应的改进方法,主要研究内容包括以下四个方面:1.提出了动态挥发率机制。在算法开始时,将挥发率设为一个较大的值,这样可以使算法的全局搜索能力得到增强,但是随着算法的进行,将不断衰减挥发率,使得算法可以较快地收敛到最优解。这样既增加了算法的全局搜索能力,又可以在一定程度上加快算法的收敛。2.借鉴强化学习的思想。引入强化学习中“奖励先进,惩罚后进”的思想到蚁群算法的信息素更新机制中,通过这种快速的两极分化来加快算法的收敛。在蚁群每次迭代完成后更新信息素的时候,奖励最好路径的同时还要给当前路径一个随机量的奖励,惩罚最差路径的同时还要给予一个随机量的惩罚。3.重新定义启发式信息。启发式信息在指导蚂蚁的路径搜索方面会产生一定的影响,在算法后期启发式信息不再是保持恒定,而是随着迭代过程不断调整,确保算法快速的收敛于最优解。4.改进变异策略。蚂蚁在搜索时都遵守“边界-中心-边界”的轨迹模式。在使用变异策略时,主要针对“边界路径”进行变异,这样既可以提高变异的效率,也可以获得更优质量的解。

全文目录


中文摘要  4-5
Abstract  5-9
第一章 绪论  9-15
  1.1 课题的背景及意义  9-10
  1.2 国内外研究现状  10-12
    1.2.1 国内研究现状  10-11
    1.2.2 国外研究现状  11-12
  1.3 研究内容及主要创新点  12-13
  1.4 论文组织结构  13-15
第二章 基础理论  15-30
  2.1 聚类  15-20
    2.1.1 聚类步骤  16
    2.1.2 数据类型及度量  16-18
    2.1.3 经典聚类方法  18-20
  2.2 强化学习概述  20-26
    2.2.1 强化学习要素  22-24
    2.2.2 强化学习算法  24-26
  2.3 蚁群优化建模  26-29
    2.3.1 蚂蚁觅食行为  26-27
    2.3.2 人工蚂蚁建模  27-28
    2.3.3 TSP 问题模型  28-29
  2.4 本章小结  29-30
第三章 基于动态挥发率的蚁群算法  30-40
  3.1 经典蚁群算法  30-34
  3.2 基于动态挥发率的蚁群算法  34-39
    3.2.1 最优模型选择  35-36
    3.2.2 DEACO 收敛性分析  36-38
    3.2.3 DEACO 多样性分析  38-39
  3.3 本章小结  39-40
第四章 基于启发式修正的蚁群算法  40-49
  4.1 启发式信息修正  40-43
    4.1.1 强化学习机制  41
    4.1.2 HAACO 收敛性分析  41-42
    4.1.3 HAACO 多样性分析  42-43
  4.2 DEAHACO 算法  43-48
    4.2.1 DEAHACO 算法步骤  44-45
    4.2.2 收敛性分析  45-47
    4.2.3 多样性分析  47-48
    4.2.4 算法性能比较  48
  4.4 本章小结  48-49
第五章 DEAHACO 聚类应用  49-60
  5.1 蚁群聚类模型  49-53
  5.2 蚁群聚类模型及算法  53-55
    5.2.1 BM 模型  53-54
    5.2.2 LF 算法  54-55
  5.3 DEAHACO 的聚类应用  55-59
    5.3.1 DEAHACO 算法性能测试  56-57
    5.3.2 DEAHACO 文本聚类  57-59
  5.4 本章小结  59-60
第六章 总结与展望  60-62
  6.1 总结  60
  6.2 展望  60-62
参考文献  62-67
攻读硕士期间发表(录用)的论文和参加的科研项目  67-68
  一、 发表(录用)的论文  67
  二、 参加的科研项目  67-68
致谢  68-69

相似论文

  1. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  2. 大学生综合素质测评研究,G645.5
  3. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  4. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  5. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
  6. 基于强化学习的改进遗传算法研究,TP18
  7. 基于数据流异常检测的嵌入式软件容错研究,TP368.1
  8. 改进蚁群算法在盲均衡中的应用,TN911.5
  9. 包含光泽材质复杂场景全局光照明的高效绘制,TP391.41
  10. 机器人系统路径规划的研究,TP242
  11. 软件体系结构自适应模型及其智能化研究,TP311.52
  12. 地铁建设项目施工风险评价方法与准则研究,U231.3
  13. 基于SPC的近海水体环境参数监控系统的研究与开发,X834
  14. 基于物流港口企业业务流程战略转型的岗位优化设置研究,F259.27;F224
  15. H型原发性高血压中医证候流行病学调查研究,R259
  16. 基于模型的动态分层强化学习算法研究,TP181
  17. 基于强化学习的机器人足球仿真系统研究与程序设计,TP242
  18. 无线传感器网络能量均衡数据汇集算法研究,TN929.5
  19. 强化学习和相关反馈在口腔正畸图像检索中的应用,TP391.41
  20. 基于GPU的并行蚁群优化算法的研究与实现,TP301.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com