学位论文 > 优秀研究生学位论文题录展示

基于马尔可夫决策过程的AUV路径规划研究

作　者: 洪晔
导　师: 边信黔
学　校: 哈尔滨工程大学
专　业: 控制理论与控制工程
关键词: 自主式水下机器人马尔可夫决策过程全局路径规划分层马尔可夫决策过程部分可观马尔可夫决策过程局部路径规划
分类号: TP242
类　型: 博士论文
年　份: 2007年
下　载: 427次
引　用: 2次
阅　读: 论文下载

内容摘要

路径规划是自主式水下机器人(简称:AUV)自主能力的重要体现,是保障AUV在大范围复杂海洋环境中自主完成使命作业的关键技术之一。为此,本文深入开展了确定性环境中全局路径规划技术、不确定环境中局部路径规划技术等自主路径规划技术的研究工作:基于马尔可夫决策过程理论,开展了大范围确定性海洋环境内AUV二维全局路径规划的研究:设计了规划模型,把路径规划问题归结为在给定环境模型和奖惩原则的情况下,寻求最优策略的问题。结合MAXQ(值函数分解)理论构造了规划问题的任务分解结构,使规划更具有逻辑性。考虑海流影响,对AUV在均匀和时变海流下的二维规划进行了仿真实验,使AUV在实际海洋环境中具备了较好的抗流能力。针对大范围海洋环境状态下的“维数灾”问题,设计了一类基于状态聚类的分层全局路径规划模型,实现一种从分层状态的概率分布到AUV采取最佳动作的优化匹配。通过分层前后规划算法的仿真数据比较表明:分层后的规划路径具有节点少,路径代价小的优点,同时减少了AUV的频繁转艏。此外,把分层思想拓展到三维环境中,提出了按深度层次分层的空间建模方法,有效地避免了计算机存储大规模数据的问题。针对不确定环境下的局部路径规划问题,研究了基于前视声纳视域模型的AUV局部路径规划方法,设计了基于部分可观马尔可夫决策过程的局部路径规划模型和水下障碍物碰撞危险度模型。针对不确定环境中可能出现的动态障碍,进行相应的运动预测和估计。首次建立了三维速度势场,将速度问题加入到路径规划模型中,对速度规划的算法进行了仿真实验。并对上述方法进行了半实物虚拟仿真联调试验,结果表明:所研究的规划算法是正确的、有效的和可行的。为了模拟AUV在复杂海洋环境的三维运动以及避障过程,设计了AUV空间避障缩尺度物理模拟试验。应用激光测距系统模拟AUV前视声纳传感器,完成在不同案例下的AUV空间避障模拟试验,并对未知环境进行探测和感知,为今后实现真实海洋环境中的AUV水下避障试验打下了基础。通过深入研究AUV的路径规划技术,提高AUV在大范围复杂、时变海洋环境中的适应性和自主作业能力,对于AUV安全、可靠、高效地自主完成远程航海与地形勘察作业使命,具有重要的理论意义及实际应用价值。

全文目录

摘要  5-7
Abstract  7-12
第1章绪论  12-27
  1.1 引言  12-14
  1.2 AUV发展概况  14-16
    1.2.1 国外AUV发展状况  14-15
    1.2.2 国内AUV发展状况  15-16
  1.3 常见的机器人路径规划方法  16-20
    1.3.1.拓扑法  16
    1.3.2 几何法  16-18
    1.3.3 单元分解(栅格)法  18
    1.3.4 人工势场法  18-19
    1.3.5 数学分析法  19-20
  1.4 课题的研究背景和意义  20-22
  1.5 马尔可夫决策过程的简介及其应用  22-23
  1.6 论文的主要研究内容和方法  23-26
    1.6.1 主要研究内容  24-25
    1.6.2 研究方法  25-26
  1.7 论文组织与安排  26-27
第2章基于马尔可夫决策过程的AUV二维全局路径规划研究  27-51
  2.1 引言  27
  2.2 马尔可夫决策过程模型  27-32
    2.2.1 MDP问题定义  27-29
    2.2.2 评价函数模型  29-30
    2.2.3 搜索策略  30-32
  2.3 AUV二维全局路径规划研究方案及工作原理  32-34
    2.3.1 研究方案的确定  32-33
    2.3.2 AUV基于MDP模型的二维全局路径规划工作流程  33-34
  2.4 基于MDP模型的AUV二维全局路径规划算法实现  34-42
    2.4.1 MAXQ分解结构模型  35-36
    2.4.2 环境状态  36-37
    2.4.3 基本动作集  37-38
    2.4.4 单步状态转移函数  38
    2.4.5 单步报酬函数  38-39
    2.4.6 基于MAXQ的评价函数  39-40
    2.4.7 MAXQ图结构  40-42
  2.5 基于MDP模型的二维全局路径规划仿真实验与分析  42-46
    2.5.1 算法流程  42-43
    2.5.2 仿真实验  43-46
  2.6 考虑海流模型的AUV二维全局路径规划  46-50
    2.6.1 仿真环境下均匀海流模型的建立  46-47
    2.6.2 均匀海流模型下的仿真实验  47-49
    2.6.3 时变海流模型下的仿真实验  49-50
  2.7 本章小结  50-51
第3章基于分层马尔可夫决策过程的AUV三维全局路径规划研究  51-63
  3.1 引言  51
  3.2 基于状态聚类的HMDP模型  51-58
    3.2.1 状态聚类  51-52
    3.2.2 状态聚类标准  52-55
    3.2.3 基于HMDP模型的二维全局路径规划仿真实验  55-58
  3.3 AUV三维全局规划算法及其仿真实验  58-62
    3.3.1 空间建模方法及其数据结构  58-59
    3.3.2 基于HMDP模型的三维全局路径规划  59-61
    3.3.3 基于HMDP模型的三维全局路径规划仿真实验  61-62
  3.4 本章小结  62-63
第4章基于部分可观马尔可夫决策过程的AUV局部路径规划研究  63-98
  4.1 引言  63-64
  4.2 POMDP模型定义  64-70
    4.2.1 POMDP模型结构  64-66
    4.2.2 信念状态  66-67
    4.2.3 信念状态的值函数  67-70
  4.3 AUV局部路径规划问题描述及其工作流程  70-71
  4.4 基于前视声纳视域模型的POMDP设计  71-82
    4.4.1 前视声纳视域模型简介  71-74
    4.4.2 POMDP模型设计  74-81
    4.4.3 未知动态障碍属性预测  81-82
  4.5 加入速度规划的POMDP模型设计  82-94
    4.5.1 加入速度的POMDP模型  82-84
    4.5.2 基于三维速度势场的动态障碍物碰撞危险度  84-88
    4.5.3 AUV局部路径规划仿真实验  88-94
  4.6 AUV局部路径规划仿真联调试验  94-97
    4.6.1 仿真平台简介  94-95
    4.6.2 仿真联调实验设计及其结果分析  95-97
  4.7 本章小结  97-98
第5章 AUV空间避障缩尺度物理模拟试验  98-122
  5.1 引言  98
  5.2 AUV空间运动模拟平台  98-103
    5.2.1 AUV空间运动模拟平台组成  98-101
    5.2.2 AUV空间避障缩尺度物理模拟试验软件设计  101-103
  5.3 激光距离检测系统  103-109
    5.3.1 激光距离检测系统的应用  103-104
    5.3.2 LMS200系统的工作原理  104-106
    5.3.3 LMS200应用软件的二次开发  106-109
  5.4 AUV空间避障缩尺度物理模拟试验案例设计及结果分析  109-121
  5.5 本章小结  121-122
结论  122-124
参考文献  124-134
攻读博士学位期间发表的论文和取得的科研成果  134-135
致谢  135

基于马尔可夫决策过程的AUV路径规划研究

内容摘要

全文目录

相似论文