学位论文 > 优秀研究生学位论文题录展示
对抗性环境下多机器人协作关键技术的研究
作 者: 罗真
导 师: 曹其新
学 校: 上海交通大学
专 业: 机械电子
关键词: 对抗 多机器人协作 环境感知 角色分工 短期预测 行为偏好
分类号: TP242
类 型: 博士论文
年 份: 2007年
下 载: 560次
引 用: 2次
阅 读: 论文下载
内容摘要
多智能移动机器人协作是当今热门研究议题。论文主要探讨对抗性环境下多智能机器人协作的相关问题。对抗性问题的特点是参与方之间存在利益冲突,参与人一般会主动去阻碍对手实现目标。机器人竞赛和军事等诸多需求使得进行该项工作具有现实意义。论文以中型足球机器人为研究对象。机器人足球对抗是球队中各机器人根据态势任务要求进行自我时空配置和执行自身行为如运球、踢球等的过程。论文首先回顾了中型自主式足球机器人的研究现状和多机器人协作涉及的关键技术,如智能系统设计、协作机制和行为生成、环境感知等。默契的团队配合有两个前提条件,一是各机器人拥有一致的准确的全局环境信息感知;二是针对各种对抗态势,各机器人对战略战术、协作机制和行为生成等都具有事先的约定或默契。因此,论文主要研究合作环境感知、协作机制和行为生成,工作成果如下:针对环境感知议题,因当前机器人个体难以只依靠自身传感器信息建立起准确的全局环境信息模型,提出了一种多机器人合作感知对抗环境全局的方法:各机器人先分别融合视觉和里程计信息实现较精确的自定位;接着根据自定位信息,各机器人分别获得各自所看到的对象分布;在信任各机器人自定位信息的前提下,通过传感信息共享,多机器人先合作识别出队友和获得队友的位姿及行为状态,然后识别出对手等其它对象的身份并确定它们的分布,从而建立起全局的环境信息模型。对象身份识别和位置分布估计主要通过将来源于各机器人的传感信息应用聚类分析等方法实现。探讨了两种环境建模水平下的多机器人协作机制和行为生成技术:一是机器人能获得自定位和队友的位姿信息及对手的粗略方位信息但无法确定对手运动状态;二是机器人能获得队友与对手等的位姿和当前行为状态的环境感知水平。针对当前的机器人环境感知水平,设计了一种中型自主式足球机器人的决策算法流程:各机器人首先各自判断对抗态势类别,确定球队当前任务;然后根据既定战略和规则,估计当前态势下各角色的合理承担者和它们的合理行为决策;最后选择执行自身行为。实践中需事先分析可能出现的态势类型和相应的合理的团队任务,制定出角色分配规则和行为产生方法等。设计时要注意各种态势转换过程中角色和行为的平滑性和一致性。根据足球对抗的特点,提出了一种结合动态角色分工与区域防守的团队协作机制,实施了基于阵型的团队组织机制。球队通过阵型配置、进攻线路安排及进攻线路转移等实现团队战术配合。因在对抗中必需协调好防守和进攻两方面的任务,提出了一种双leader型的球队阵型组织和控制方法:由守门员或后卫根据具体态势牵头构建防守阵式,由当前最紧要队员承担主动拦截抢球或主动进攻的leader角色来组织进攻阵式。根据足球对抗和角色分工的特点,应用局部协调方法,提出了一种团队任务紧迫优先的规划算法。针对第二种环境感知水平,提出和分析了一种以量化分析为基础的基于短期预测的对抗规划方法。它假设机器人不知道对手是否理性,基本算法流程为:先预测出在某些短期未来时刻点的对抗双方的可能状态组合;然后评估出己方各种状态组合下的期望收益,并据此建立决策树;最后根据决策树进行行为决策。因特定态势下机器人一般只执行特定行为,论文引入了行为偏好的概念。结合基于短期预测的思想,提出了一种自适应的对抗规划方法:通过不断修正对对手行为偏好的估计,更好地把握对手的行为决策,从而使行为决策能在对抗活动中不断合理化。此外,初步开发了一种图形化的行为和编队编辑系统。实践实验和仿真结果证明,所探讨的理论和方法具有一定的有效性和合理性。
|
全文目录
摘要 5-8 ABSTRACT 8-17 第一章 绪论 17-52 1.1 引言 17-19 1.2 对抗博弈 19-23 1.2.1 对抗博弈 19-20 1.2.2 常见的对抗博弈 20-23 1.3 多机器人协作系统关键设计技术 23-40 1.3.1 机器人智能系统设计技术 24-27 1.3.2 环境感知技术 27-31 1.3.3 多机器人行为协作 31-36 1.3.4 学习和自适应技术 36-39 1.3.5 对抗性环境中多机器人协作特点 39-40 1.4 足球机器人技术 40-50 1.4.1 球队构成 40-41 1.4.2 机器人平台构成 41-42 1.4.3 中型自主式足球机器人球队研究议题 42-44 1.4.4 足球机器人研究现状 44-50 1.5 研究意义和研究内容 50-52 第二章 合作环境感知 52-74 2.1 环境传感硬件配置 52-53 2.2 全局环境信息建模基本流程 53-54 2.3 基于视觉和里程计信息的机器人自定位 54-61 2.3.1 基于全维视觉的三角定位 55-56 2.3.2 定位完整算法 56-58 2.3.3 影响运动中定位精度的时间因素 58-59 2.3.4 实验 59-61 2.4 多机器人协作环境信息建模 61-67 2.4.1 时间同步 61-62 2.4.2 基本流程 62-63 2.4.3 队内环境信息传递 63-64 2.4.4 队友和对手识别 64-66 2.4.5 实践效果与改进 66-67 2.5 运动估计 67-72 2.5.1 基本算法流程 67-69 2.5.2 滤波 69-71 2.5.3 实验 71 2.5.4 实验结果分析 71-72 2.6 小结 72-74 第三章 多机器人对抗规划 74-101 3.1 环境感知与对抗决策技术 75-76 3.2 角色分工 76-80 3.2.1 角色分工 76-77 3.2.2 区域防守型角色分工 77-78 3.2.3 动态角色分工型协作 78-80 3.3 自主式机器人球队决策 80-89 3.3.1 基本决策流程 80-82 3.3.2 态势分类和团队任务设计 82-84 3.3.3 对抗态势估计 84-87 3.3.4 团队协作行为决策 87-89 3.4 基于阵型的协作 89-96 3.4.1 阵型 89-91 3.4.2 双leader 型球队阵型实现 91-92 3.4.3 进攻线路和转移进攻战术 92-93 3.4.4 传球配合实现 93-96 3.5 局部协调策略和协调图 96-99 3.5.1 协调图 96-98 3.5.2 团队任务紧迫优先协调方法 98-99 3.6 实践应用和球队战果 99-100 3.7 小结 100-101 第四章 基于短期预测的对抗规划 101-131 4.1 引言 101-103 4.1.1 基于短期预测的对抗规划技术的基本思想 101-103 4.2 基于短期预测的追捕-逃避方法 103-114 4.2.1 问题描述 103-104 4.2.2 短期预测策略的可行性 104-107 4.2.3 基于短期预测追捕应对 107-111 4.2.4 仿真 111-113 4.2.5 实验 113-114 4.3 预测时间和预测步数选择 114-120 4.3.1 预测时间选择 115-117 4.3.2 预测步数选择 117 4.3.3 仿真实验 117-120 4.4 基于对手行为偏好的自适应预测对抗规划方法 120-127 4.4.1 说明 120-121 4.4.2 行为决策过程 121-122 4.4.3 收益评估和行为决策 122-123 4.4.4 对手行为偏好估计 123-124 4.4.5 仿真试验 124-127 4.5 应用探讨 127-130 4.5.1 多机器人团队收益函数构造 127-129 4.5.2 短期预测方法应用场合 129-130 4.6 小结 130-131 第五章 行为与编队编辑系统设计 131-140 5.1 引言 131-132 5.2 个体和团队行为编辑系统设计 132-139 5.2.1 开放式体系结构 132-134 5.2.2 图形界面设计 134-135 5.2.3 位姿可达性和机器人行为选择 135-137 5.2.4 通过设置窗口编辑机器人宏行为 137-138 5.2.5 宏行为保存 138-139 5.3 小结 139-140 第六章 总结 140-144 6.1 论文工作总结 140-142 6.2 贡献和创新点 142-143 6.3 不足和未来工作 143-144 参考文献 144-152 附录1 自主式足球机器人竞赛体系系统软件第二版简介 152-159 附录2 一对一追捕逃避游戏仿真软件简介 159-161 附录3 多机器人协作仿真软件简介 161-163 致谢 163-164 论文写作、专利申请和竞赛获奖情况 164
|
相似论文
- 光电对抗试验系统软件平台开发,TP311.52
- 孙子兵法与拳击对抗的谋略制胜,G886.1
- 论麦克卢汉的媒介杂交理论,G206
- 8-12GHz可变带宽旋磁带阻滤波器及数字驱动控制研究,TN713
- 星载雷达干扰机技术与仿真研究,TN974
- 基于博弈论的足球机器人对抗策略与协调合作,TP242
- 我国民事诉讼证人出庭作证制度研究,D925.1
- 面向QoS的Web服务可信性评价方法研究,TP393.08
- KD-JMASE在分布式仿真中的应用研究,TP391.9
- 创业机会类型、环境感知与创业绩效研究,F272
- 基于PCA-BP模型的上证综指预测研究,F832.51
- 城市日用水量预测及监测点优化布置技术研究与应用,TU991.33
- 我国刑事证据开示制度研究,D925.2
- 领导权与意识形态——关于拉克劳意识形态理论的研究,B089
- 同步轨道通信卫星对抗仿真系统的设计与实现,TN975
- 时间序列短期预测的方法和技术,F830.9
- 基于国有林权改革的森林经营主体及其行为研究,F326.2
- 在理想与虚无之间,I207.42
- 我国区域经济合作中的地方政府行为,F127
- 中国大陆网络耽美文化研究,G122
- 机动车登记效力的三个基本问题研究,D923
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 机器人技术 > 机器人
© 2012 www.xueweilunwen.com
|