学位论文 > 优秀研究生学位论文题录展示
基于马尔可夫决策过程的AUV路径规划研究
作 者: 洪晔
导 师: 边信黔
学 校: 哈尔滨工程大学
专 业: 控制理论与控制工程
关键词: 自主式水下机器人 马尔可夫决策过程 全局路径规划 分层马尔可夫决策过程 部分可观马尔可夫决策过程 局部路径规划
分类号: TP242
类 型: 博士论文
年 份: 2007年
下 载: 427次
引 用: 2次
阅 读: 论文下载
内容摘要
路径规划是自主式水下机器人(简称:AUV)自主能力的重要体现,是保障AUV在大范围复杂海洋环境中自主完成使命作业的关键技术之一。为此,本文深入开展了确定性环境中全局路径规划技术、不确定环境中局部路径规划技术等自主路径规划技术的研究工作:基于马尔可夫决策过程理论,开展了大范围确定性海洋环境内AUV二维全局路径规划的研究:设计了规划模型,把路径规划问题归结为在给定环境模型和奖惩原则的情况下,寻求最优策略的问题。结合MAXQ(值函数分解)理论构造了规划问题的任务分解结构,使规划更具有逻辑性。考虑海流影响,对AUV在均匀和时变海流下的二维规划进行了仿真实验,使AUV在实际海洋环境中具备了较好的抗流能力。针对大范围海洋环境状态下的“维数灾”问题,设计了一类基于状态聚类的分层全局路径规划模型,实现一种从分层状态的概率分布到AUV采取最佳动作的优化匹配。通过分层前后规划算法的仿真数据比较表明:分层后的规划路径具有节点少,路径代价小的优点,同时减少了AUV的频繁转艏。此外,把分层思想拓展到三维环境中,提出了按深度层次分层的空间建模方法,有效地避免了计算机存储大规模数据的问题。针对不确定环境下的局部路径规划问题,研究了基于前视声纳视域模型的AUV局部路径规划方法,设计了基于部分可观马尔可夫决策过程的局部路径规划模型和水下障碍物碰撞危险度模型。针对不确定环境中可能出现的动态障碍,进行相应的运动预测和估计。首次建立了三维速度势场,将速度问题加入到路径规划模型中,对速度规划的算法进行了仿真实验。并对上述方法进行了半实物虚拟仿真联调试验,结果表明:所研究的规划算法是正确的、有效的和可行的。为了模拟AUV在复杂海洋环境的三维运动以及避障过程,设计了AUV空间避障缩尺度物理模拟试验。应用激光测距系统模拟AUV前视声纳传感器,完成在不同案例下的AUV空间避障模拟试验,并对未知环境进行探测和感知,为今后实现真实海洋环境中的AUV水下避障试验打下了基础。通过深入研究AUV的路径规划技术,提高AUV在大范围复杂、时变海洋环境中的适应性和自主作业能力,对于AUV安全、可靠、高效地自主完成远程航海与地形勘察作业使命,具有重要的理论意义及实际应用价值。
|
全文目录
摘要 5-7 Abstract 7-12 第1章 绪论 12-27 1.1 引言 12-14 1.2 AUV发展概况 14-16 1.2.1 国外AUV发展状况 14-15 1.2.2 国内AUV发展状况 15-16 1.3 常见的机器人路径规划方法 16-20 1.3.1.拓扑法 16 1.3.2 几何法 16-18 1.3.3 单元分解(栅格)法 18 1.3.4 人工势场法 18-19 1.3.5 数学分析法 19-20 1.4 课题的研究背景和意义 20-22 1.5 马尔可夫决策过程的简介及其应用 22-23 1.6 论文的主要研究内容和方法 23-26 1.6.1 主要研究内容 24-25 1.6.2 研究方法 25-26 1.7 论文组织与安排 26-27 第2章 基于马尔可夫决策过程的AUV二维全局路径规划研究 27-51 2.1 引言 27 2.2 马尔可夫决策过程模型 27-32 2.2.1 MDP问题定义 27-29 2.2.2 评价函数模型 29-30 2.2.3 搜索策略 30-32 2.3 AUV二维全局路径规划研究方案及工作原理 32-34 2.3.1 研究方案的确定 32-33 2.3.2 AUV基于MDP模型的二维全局路径规划工作流程 33-34 2.4 基于MDP模型的AUV二维全局路径规划算法实现 34-42 2.4.1 MAXQ分解结构模型 35-36 2.4.2 环境状态 36-37 2.4.3 基本动作集 37-38 2.4.4 单步状态转移函数 38 2.4.5 单步报酬函数 38-39 2.4.6 基于MAXQ的评价函数 39-40 2.4.7 MAXQ图结构 40-42 2.5 基于MDP模型的二维全局路径规划仿真实验与分析 42-46 2.5.1 算法流程 42-43 2.5.2 仿真实验 43-46 2.6 考虑海流模型的AUV二维全局路径规划 46-50 2.6.1 仿真环境下均匀海流模型的建立 46-47 2.6.2 均匀海流模型下的仿真实验 47-49 2.6.3 时变海流模型下的仿真实验 49-50 2.7 本章小结 50-51 第3章 基于分层马尔可夫决策过程的AUV三维全局路径规划研究 51-63 3.1 引言 51 3.2 基于状态聚类的HMDP模型 51-58 3.2.1 状态聚类 51-52 3.2.2 状态聚类标准 52-55 3.2.3 基于HMDP模型的二维全局路径规划仿真实验 55-58 3.3 AUV三维全局规划算法及其仿真实验 58-62 3.3.1 空间建模方法及其数据结构 58-59 3.3.2 基于HMDP模型的三维全局路径规划 59-61 3.3.3 基于HMDP模型的三维全局路径规划仿真实验 61-62 3.4 本章小结 62-63 第4章 基于部分可观马尔可夫决策过程的AUV局部路径规划研究 63-98 4.1 引言 63-64 4.2 POMDP模型定义 64-70 4.2.1 POMDP模型结构 64-66 4.2.2 信念状态 66-67 4.2.3 信念状态的值函数 67-70 4.3 AUV局部路径规划问题描述及其工作流程 70-71 4.4 基于前视声纳视域模型的POMDP设计 71-82 4.4.1 前视声纳视域模型简介 71-74 4.4.2 POMDP模型设计 74-81 4.4.3 未知动态障碍属性预测 81-82 4.5 加入速度规划的POMDP模型设计 82-94 4.5.1 加入速度的POMDP模型 82-84 4.5.2 基于三维速度势场的动态障碍物碰撞危险度 84-88 4.5.3 AUV局部路径规划仿真实验 88-94 4.6 AUV局部路径规划仿真联调试验 94-97 4.6.1 仿真平台简介 94-95 4.6.2 仿真联调实验设计及其结果分析 95-97 4.7 本章小结 97-98 第5章 AUV空间避障缩尺度物理模拟试验 98-122 5.1 引言 98 5.2 AUV空间运动模拟平台 98-103 5.2.1 AUV空间运动模拟平台组成 98-101 5.2.2 AUV空间避障缩尺度物理模拟试验软件设计 101-103 5.3 激光距离检测系统 103-109 5.3.1 激光距离检测系统的应用 103-104 5.3.2 LMS200系统的工作原理 104-106 5.3.3 LMS200应用软件的二次开发 106-109 5.4 AUV空间避障缩尺度物理模拟试验案例设计及结果分析 109-121 5.5 本章小结 121-122 结论 122-124 参考文献 124-134 攻读博士学位期间发表的论文和取得的科研成果 134-135 致谢 135
|
相似论文
- 面向GPS导航拖拉机的最优全局覆盖路径规划研究,TN967.1
- 基于PULL策略的再制造/制造混合系统库存控制研究,F224
- 机器人系统路径规划的研究,TP242
- 超市多任务机器人实用化路径规划方法研究,TP242
- 自主式水下机器人冗余自救系统的设计与实现,TP242
- 视觉导航中局部路径规划方法研究及嵌入式实现,TP242
- 自主移动机器人导航与控制中的增强学习方法研究,TP242.6
- 复杂切换场景下异构无线网络选择算法研究,TN929.5
- 基于马尔科夫模型的风电机组优化检修,O211.62
- 自主式水下机器人测控系统软件设计与实现,TP311.52
- 认知无线电网络的累加干扰分析,TN925
- 基于规划融合的多Agent系统协调机制研究,TP18
- 水下机器人路径规划技术,TP242
- 双波传播算法在水下潜器路径规划中的应用,TP242
- 基于马尔可夫决策过程理论的Agent决策问题研究,TP18
- 促超排卵疗程中的药物剂量优化,F224
- AUV自适应局部路径规划,TP242
- 足球仿人机器人的视觉系统的设计与研究,TP242.62
- 基于传感器的煤矿救援机器人局部路径规划,TP242
- 动态未知环境下移动机器人的实时路径规划,TP242.6
- 移动机器人路径规划研究,TP242
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 机器人技术 > 机器人
© 2012 www.xueweilunwen.com
|