学位论文 > 优秀研究生学位论文题录展示
基于强化学习的蚁群聚类研究及应用
作 者: 陈浩
导 师: 刘全
学 校: 苏州大学
专 业: 计算机软件和理论
关键词: 蚁群优化 强化学习 聚类分析 动态挥发率 变异策略
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 22次
引 用: 0次
阅 读: 论文下载
内容摘要
蚁群算法是利用群体智能解决实际问题的一个典型实例。20世纪90年代由意大利的Dorigo等学者提出,是继遗传算法、模拟退火、神经网络之后的一种新的元启发式搜索算法。自提出以来,在分布式控制、智能优化、数据挖掘等方面得到了广泛的应用。尽管如此,蚁群算法在理论和应用方法上还有很多亟待完善之处,如易于陷入停滞、收敛速度慢等问题。针对蚁群算法存在的易于停滞、收敛速度慢等问题,本文从蚁群优化在TSP问题中的应用角度出发,提出了相应的改进方法,主要研究内容包括以下四个方面:1.提出了动态挥发率机制。在算法开始时,将挥发率设为一个较大的值,这样可以使算法的全局搜索能力得到增强,但是随着算法的进行,将不断衰减挥发率,使得算法可以较快地收敛到最优解。这样既增加了算法的全局搜索能力,又可以在一定程度上加快算法的收敛。2.借鉴强化学习的思想。引入强化学习中“奖励先进,惩罚后进”的思想到蚁群算法的信息素更新机制中,通过这种快速的两极分化来加快算法的收敛。在蚁群每次迭代完成后更新信息素的时候,奖励最好路径的同时还要给当前路径一个随机量的奖励,惩罚最差路径的同时还要给予一个随机量的惩罚。3.重新定义启发式信息。启发式信息在指导蚂蚁的路径搜索方面会产生一定的影响,在算法后期启发式信息不再是保持恒定,而是随着迭代过程不断调整,确保算法快速的收敛于最优解。4.改进变异策略。蚂蚁在搜索时都遵守“边界-中心-边界”的轨迹模式。在使用变异策略时,主要针对“边界路径”进行变异,这样既可以提高变异的效率,也可以获得更优质量的解。
|
全文目录
中文摘要 4-5 Abstract 5-9 第一章 绪论 9-15 1.1 课题的背景及意义 9-10 1.2 国内外研究现状 10-12 1.2.1 国内研究现状 10-11 1.2.2 国外研究现状 11-12 1.3 研究内容及主要创新点 12-13 1.4 论文组织结构 13-15 第二章 基础理论 15-30 2.1 聚类 15-20 2.1.1 聚类步骤 16 2.1.2 数据类型及度量 16-18 2.1.3 经典聚类方法 18-20 2.2 强化学习概述 20-26 2.2.1 强化学习要素 22-24 2.2.2 强化学习算法 24-26 2.3 蚁群优化建模 26-29 2.3.1 蚂蚁觅食行为 26-27 2.3.2 人工蚂蚁建模 27-28 2.3.3 TSP 问题模型 28-29 2.4 本章小结 29-30 第三章 基于动态挥发率的蚁群算法 30-40 3.1 经典蚁群算法 30-34 3.2 基于动态挥发率的蚁群算法 34-39 3.2.1 最优模型选择 35-36 3.2.2 DEACO 收敛性分析 36-38 3.2.3 DEACO 多样性分析 38-39 3.3 本章小结 39-40 第四章 基于启发式修正的蚁群算法 40-49 4.1 启发式信息修正 40-43 4.1.1 强化学习机制 41 4.1.2 HAACO 收敛性分析 41-42 4.1.3 HAACO 多样性分析 42-43 4.2 DEAHACO 算法 43-48 4.2.1 DEAHACO 算法步骤 44-45 4.2.2 收敛性分析 45-47 4.2.3 多样性分析 47-48 4.2.4 算法性能比较 48 4.4 本章小结 48-49 第五章 DEAHACO 聚类应用 49-60 5.1 蚁群聚类模型 49-53 5.2 蚁群聚类模型及算法 53-55 5.2.1 BM 模型 53-54 5.2.2 LF 算法 54-55 5.3 DEAHACO 的聚类应用 55-59 5.3.1 DEAHACO 算法性能测试 56-57 5.3.2 DEAHACO 文本聚类 57-59 5.4 本章小结 59-60 第六章 总结与展望 60-62 6.1 总结 60 6.2 展望 60-62 参考文献 62-67 攻读硕士期间发表(录用)的论文和参加的科研项目 67-68 一、 发表(录用)的论文 67 二、 参加的科研项目 67-68 致谢 68-69
|
相似论文
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 大学生综合素质测评研究,G645.5
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
- 基于强化学习的改进遗传算法研究,TP18
- 基于数据流异常检测的嵌入式软件容错研究,TP368.1
- 改进蚁群算法在盲均衡中的应用,TN911.5
- 包含光泽材质复杂场景全局光照明的高效绘制,TP391.41
- 机器人系统路径规划的研究,TP242
- 软件体系结构自适应模型及其智能化研究,TP311.52
- 地铁建设项目施工风险评价方法与准则研究,U231.3
- 基于SPC的近海水体环境参数监控系统的研究与开发,X834
- 基于物流港口企业业务流程战略转型的岗位优化设置研究,F259.27;F224
- H型原发性高血压中医证候流行病学调查研究,R259
- 基于模型的动态分层强化学习算法研究,TP181
- 基于强化学习的机器人足球仿真系统研究与程序设计,TP242
- 无线传感器网络能量均衡数据汇集算法研究,TN929.5
- 强化学习和相关反馈在口腔正畸图像检索中的应用,TP391.41
- 基于GPU的并行蚁群优化算法的研究与实现,TP301.6
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|