一、智能水下机器人分层全局路径规划方法研究(论文文献综述)
徐炜翔[1](2020)在《面向水下自主航行器回收的路径规划研究》文中研究说明近年来自主式水下航行器(Autonomous Underwater Vehicle,AUV)以其使命自主、便捷布放、改装空间大等优点在一系列水下潜器中脱颖而出,成为完成各类水下任务的首选设备。在回收任务中实现自主导航对接是AUV必备的能力,由于海洋环境的复杂多变特性还有AUV自身携带能源的限制,设计一条归航路径能够同时满足避障需求和提高AUV续航能力就显得十分关键,对保障回收对接成功具有重要意义。针对传统AUV路径规划中模型过于简单导致实际规划能力差、特异性研究不足导致无法应用于回收任务等问题,本文进行了深入研究。基于实验室参与研制的小型AUV与水下静基座回收对接平台,通过分析回收过程中不同阶段对路径规划的具体要求,将回收过程中的路径规划分为三个子问题分别研究,提出一种面向AUV回收对接的路径规划方法。主要研究内容如下:首先,针对全局路径规划中存在的海流干扰问题,提出基于AUV能耗模型融合不规则海流的航行能耗代价函数;针对传统路径规划方法中过早收敛路径曲折的问题,提出基于飞蛾焰火算法的路径更新机制,避免陷入局部最优、提高全局搜索能力,完成基于已知海洋环境信息的全局路径规划。通过设计对比仿真实验,验证了方法的可行性。然后,针对存在未知复杂运动障碍物威胁的实时避碰问题,利用扩展卡尔曼滤波算法对前视声呐传感器获取的障碍物状态信息进行状态估计和轨迹预测,判断AUV与障碍物的碰撞风险。采用同时调节航向和航速的复合避碰策略,提出基于速度矢量合成的规划方法,实现高效的实时避碰完成在线路径规划。通过设计不同环境下仿真实验,验证了方法的可行性。最后,针对回收任务末段对接口对AUV的对接艏向约束问题,提出基于改进人工势场法的导引路径规划方法。通过在对接口中心沿线后方设置虚拟球形斥力场,并设计引力场分段函数,使AUV从任意方向接近对接平台都可以沿光滑弧形路径到达对接口中心沿线上,提高对接成功率。通过设计仿真实验,验证了方法的可行性。
徐杨[2](2020)在《海生物抓取捕捞水下机器人运动规划研究》文中研究指明随着水下机器人作业技术的发展,越来越多的复杂作业任务被水下机器人所承担,水下机器人的自主作业也成为了水下机器人作业技术的研究热点以及未来方向。水下机器人的自主作业研究是一个交叉领域,需要机器人运动控制、运动规划、导航定位、视觉感知等多个学科领域的紧密配合。其中,水下机器人运动规划技术是承担机器人作业功能实现的重要一环。为了满足水下机器人在水下环境的安全性目的,传统的水下机器人运动规划技术主要是设计一条从出发点到目的地的一条无碰轨迹。主要方法有基于几何图形建模的方法以及基于势场建模的方法。传统的水下机器人运动规划方法有着搜索效率低、易陷入局部收敛的缺点。相比于传统的智能水下机器人作业需求,海生物抓取捕捞水下机器人的作业任务和作业环境更为复杂,传统的水下机器人运动规划方法也很难满足其复杂的作业需求。因此,除了要按照其作业目的对作业任务进行分解以外,更加智能、先进的方法也应运用于作业机器人的运动规划中。本文的主要研究内容如下:1)针对机器人在海洋牧场中作业的全局搜索任务,提出了使用深度强化学习算法对机器人的全局规划进行研究。为了使机器人在海洋牧场中能进行更有效率地作业,对全局搜索规划进行了任务分解;为了满足灵活规划要求,使用了基于深度强化学习的值迭代网络进行全局规划,提高了规划的效率同时也保证了规划的准确度;为了提高机器人运动规划时的寻优效率,使用了粒子群算法对机器人的搜索顺序进行寻优。实验证明,本文所提出的全局规划算法能够更有效地进行最优路径的搜索。2)针对机器人在海洋牧场中可能会遇到的局部避障规划任务,提出了使用改进后的快速探索随机树算法(RRT)对局部避障进行规划。针对RRT算法搜索效率慢、路径不平滑等缺点进行改进,取得了明显的效果3)针对机器人发现目标物后的局部抓取作业任务,提出了使用改进后的多目标进化算法进行机器人局部抓取规划的研究。为了满足机器人在线规划的实时性要求,使用了骨干粒子群优化算法作为进化算法的核心算法;为了满足算法在多约束情况下的搜索性能,使用了时变可行性阈值以及时变变异因子提高了算法的搜索性能。在仿真试验中表明,改进后的多目标进化算法能够满足机器人实时在线抓取作业规划的需求。
武凯凯[3](2020)在《基于强化学习算法的AUV路径规划研究》文中指出自主水下航行器(Autonomous Underwater Vehicle,简称AUV)作为重要的水下探索工具,是世界各国重点研究的方向之一。由于水下环境的特殊性和复杂性,AUV的自主性是体现其智能性的关键。要实现AUV的自主航行和自主作业,路径规划技术在其中发挥着重要的作用。路径规划水平的高低在一定程度上决定着AUV自主能力的高低,因此,探索一种适应复杂环境的路径规划方法具有重要的实际意义。强化学习是目前最具发展潜力的人工智能方法之一,由于其能够通过与环境的不断交互来实现系统性能的优化,因此,强化学习对环境具有较强的自适应能力。本文主要是根据强化学习的特点,将其应用到AUV的路径规划中,以提高AUV对水下环境的自适应能力。在实际作业中,AUV的运动过程可以分成两个过程:下潜过程和定深作业时的水平运动过程。因此,本论文的主要研究内容如下:首先,对强化学习原理进行了详细的分析,包括强化学习的模型、要素以及算法,以AUV路径规划为应用背景,分析了强化学习在实际应用中需要注意的问题。其次,将强化学习中的Q学习应用到AUV定深作业时的局部路径规划中。根据AUV前视声呐的特性设计了模拟传感器,并在其基础上搭建了AUV环境训练场,为下一步路径规划的设计提供了有效的验证平台。针对Q学习收敛速度慢的问题,使用资格迹技术进行了加速。接着,设计了基于改进Q学习的路径规划方法,最后,对所设计的AUV路径规划方法进行了仿真验证。再次,针对Q学习在面对连续空间时存在的不足,提出了将深度Q学习应用到AUV的局部路径规划中。分析了神经网络的实现过程,在此基础上对深度Q学习进行了网络结构设计,使用了优先级经验回放缓冲区以提高算法学习的效率。设计了基于深度Q学习的AUV路径规划方法,最后,对所设计的方法进行了仿真验证。最后,使用改进的快速扩展随机树(Rapidly-exploring Random Tree,简称RRT)算法对AUV进行三维路径规划,使AUV能够下潜到指定的深度进行作业。针对RRT算法的不足,提出了改进的RRT算法,将强化学习的自学习能力引入到RRT算法中来近似搜索最近邻节点,并在算法中加入了目标偏置策略,提高了RRT算法的收敛速度。此外,还提出了一种“倒序平滑法”的平滑策略以解决路径的冗余节点问题。最后,对所设计的方法进行了仿真验证。
王力锋[4](2019)在《基于强化学习的AUV行为重规划方法研究》文中进行了进一步梳理智能水下机器人(Autonomous Underwater Vehicle,AUV)是海洋资源开发的关键装备技术之一,随着作业任务越来越复杂,对AUV自主决策能力要求也越高。规划技术是实现AUV智能化决策的重要手段,决定了 AUV与外界环境的交互能力,是自主完成作业任务的前提基础。本文重点研究复杂环境下的全局规划和局部行为重规划技术,以隧洞探测任务为典型应用背景,结合人工智能技术,将分层强化学习方法应用到AUV全局航路规划任务中,将深度强化学习应用到AUV行为重规划方法中,并有机的结合全局航路规划和局部行为重规划,赋予AUV规划系统自学习能力,提高环境自适应性。首先针对全局航路规划中复杂环境状态的维数灾问题,深入分析了分层强化学习方法的理论与应用,由高到低建立了全局航路规划任务的分层结构,包括:航路规划根任务层、子任务选择层和基本动作层,这种方法易于拓展,可以将问题分解到低维空间上求解。然后,基于分层强化学习算法的原理设计AUV全局航路规划模型:建立环境状态模型和动作模型,设计航路规划任务的评价函数。最后搭建仿真试验平台进行试验以验证算法的准确和实用性。针对复杂动态环境下的AUV行为重规划问题,采用深度强化学习算法,设计了基于多行为网络调用的行为重规划体系结构。然后构建了行为重规划系统模型,规划系统以深度学习网络提取连续环境特征,以强化学习输出动作的近似值函数,形成环境状态-动作的映射,解决了连续环境状态下的感知和决策问题。针对隧洞探测任务的需求定义了趋向目标点、墙壁跟踪和避障三种典型行为,分别构建了对应的行为网络。针对每种行为目标,设计对应的输入环境变量和奖惩函数,构建了基本动作空间。针对墙角问题,提出了基于虚拟目标点改进的墙壁跟踪方法。最后基于Python平台搭建仿真环境并编写学习算法,进行了单一行为在多种环境下的仿真试验以及多行为调用试验。本文将强化学习算法与AUV规划系统相结合,提高了 AUV的自适应水平和自主决策能力。全局航路规划是任务的前提,AUV在实际执行过程中根据全局规划输出的路径点,通过调用行为网络依次达到路径点从而完成任务。在行为重规划系统中针对不同行为需求构建不同的网络模型,使AUV在作业过程中根据实时环境调用相关的行为网络,提高AUV在复杂未知环境下的规划水平。
李沛伦[5](2019)在《水下滑翔机的路径规划研究》文中进行了进一步梳理低能耗、大航程的水下机器人一直为各国的研究热点,在这种需求驱动下,新概念水下机器人——水下滑翔机应运而生。水下滑翔机利用净浮力驱动,具有续航强、成本低、噪声小等优点,适合长周期、大航程的水下任务。路径规划问题是水下滑翔机研究领域的难点问题之一,存在许多悬而未决的问题。本文利用水下滑翔机航行轨迹的特殊性,将水下滑翔机的三维路径规划问题简化为二维纵剖面上的避障问题与二维水平面上的全局路径规划问题,旨在根据水下滑翔机的特点,结合改进的优化算法,解决一些简单情形下水下滑翔机在海洋环境中的避障及全局路径规划问题,希望可以为水下滑翔机的路径规划研究提供一定借鉴意义。具体研究内容包含以下几方面:(1)基于能耗最优的水下滑翔机路径参数优化问题。首先,分析了定常运动时水下滑翔机的受力情况,完善并系统地建立其能耗模型。然后,基于单周期、固定水平滑翔距离两种情形研究了能耗与滑翔参数的变化关系,并简单探讨了最优解计算问题。(2)单个运动周期下躲避水中障碍物的路径规划问题。首先,对传统的人工势场法进行了改进,以克服常见的局部极值与目标不可达问题,并引入速度势场函数,将静态势场转变为动态势场。然后,考虑水下滑翔机的运动约束,引入定常流,分别在静态环境和动态环境下做了仿真试验。仿真结果表明,所用方法能使水下滑翔机在有海流或无海流作用下成功避开水中静态与动态障碍物。(3)多个运动周期组成的全局路径规划问题。首先,从电子海图提取所需的环境信息,采用栅格法进行环境建模。然后,采用流函数法生成海流场,并建立栅格数据结构存储海流信息。最后,以能耗、路径长度、路径安全性为优化目标构造路径评价函数,采用GA-PSO混合算法对水下滑翔机进行全局路径规划。仿真结果表明:所用方法可以在海流作用下,根据不同的优化目标规划出相应的最优路径,与单一算法相比,所用的混合算法收敛速度更快。
代长安[6](2019)在《基于强化学习的AUV任务规划技术研究》文中指出近几年,海洋资源及海洋权益受到人们广泛的关注,AUV作为智能的自主式水下航行器得到了极大的发展。在AUV相关技术中,任务规划是其重要的组成部分,任务规划的结果将直接影响任务完成程度及AUV自身安全。针对AUV的任务规划技术,分别从体系结构设计、航路规划及多目标点探测任务规划进行研究。为提高海底探测型AUV的智能性及自适应性,完成了“橙鲨”AUV自学习体系结构设计:结合强化学习思想设计学习进化单元,使AUV可以通过和环境交互的方式,提升执行器输出结果的准确性,使AUV不断地在学习过程中提升智能化水平。加入了学习监督单元的设计,可根据AUV所处环境复杂度的不同及学习进程,在线动态调整动作选择策略,使该策略可以更好地和环境相契合,加快学习过程。设计任务分层及重规划单元时,加入了环境空间分层模块设计,通过对作业环境的分层得到不同层次的子任务,重规划模块则根据受突发状况影响的子任务进行任务重规划,提高了规划的精准性、时效性。结合上述单元,完成了“橙鲨”AUV自学习体系结构框架设计。为解决AUV全局航路规划问题,Q学习模型可以提高AUV的智能水平及规划的合理性,但其中的探索-利用平衡问题影响着规划结果的好坏,探索不足将导致陷入局部最优解,过度探索将降低学习效率。为解决上述问题,提出环境复杂度评估的自适应Q学习方法。通过对环境复杂程度的评估,可以更好地确定探索-利用平衡策略,在规划过程中,根据实际情况不断调整策略,避免陷入局部最优解,加快算法收敛,加快航路规划。为解决路径优化问题,提出了最佳切入角的数学模型,提高了光顺后的航路的合理性及安全性。为解决AUV多目标点探测任务规划时,现有算法计算量较大、规划时间较长的问题,提出区域划分的分层Q学习算法,将环境状态空间根据目标点所在区域进行划分,得到相应子区域及子任务,将复杂任务转换成较简单的子任务序列,减少了规划的计算量及时间,提高了规划效率。为解决航行过程中目标点突变问题,提出局部代价最小区域模型,设计了在线动态重规划方案,提高了规划的时效性,完成了 AUV多目标点探测任务的航路规划及重规划工作。最后,结合实际海岛环境对提出的学习模型进行评估,结合“长岛”环境进行自适应Q学习模型的仿真实验,采用“长海”环境进行区域划分的分层Q学习模型的仿真实验。通过对仿真结果的分析,验证了提出的学习模型可以优化任务规划的结果,并且能够提高任务规划的效率。
张倩倩[7](2019)在《人在回路的无人水下航行器指控任务规划方法研究》文中认为人在回路的无人水下航行器(UUV,Unmanned Underwater Vehicles)指控任务规划问题,是指UUV执行任务之前,由指挥员下达任务目标,通过UUV指控系统调用时间序列规划算法和空间路径规划算法,完成UUV指控任务规划,并以XML文档格式将规划结果下载至UUV的机载任务控制系统,供UUV后续自主执行任务;在UUV任务执行过程中,由于环境、UUV自身或任务要素均可能存在不确定性影响因素,在通信可达的情况下,UUV指控系统利用监测信息完成不确定事件的威胁评估,针对影响UUV安全性的不确定事件完成UUV指控任务重规划,并将重规划结果下载至UUV机载系统以便实施任务干预,使之在保证UUV安全性的前提下尽可能地满足任务目标的要求。本文以UUV为任务(重)规划对象,以UUV所执行的任务要素为目标牵引,从任务要素的XML文本描述、指控任务规划与重规划方法设计、人在回路的UUV指控任务(重)规划仿真平台构建等方面完成以下内容的研究:首先,使用XML语言对UUV的任务要素进行规范化表达。针对一般的文本描述方式对于操作平台的兼容性较差和复杂任务要素描述的复杂性不利于计算机解析与识别的问题,采用XML科学描述语言设计了一种指控任务要素的规范化、科学化且统一化的定义方法。XML的结构性科学标记优势,使其具有优良的跨平台交互性、数据存储性与要素分析能力,能够较好地满足复杂指控任务要素的数据结构描述需求,且便于UUV指控任务执行过程中人在回路的任务要素交互与存储;结合区域勘察任务仿真案例,给出UUV指控任务要素的XML定义与描述实例。其次,针对人在回路的UUV指控任务的时间序列规划与空间路径规划需求,设计基于改进蚁群算法的时间序列规划,算法中设计状态转移概率以及信息素更新策略等,使得UUV指控任务的时间调度方案近似最优;确定任务的执行顺序以后,采用基于改进的遗传算法对任务进行空间路径规划,算法中设计一维编码方式、适应度函数、精英选择策略、自适应的交叉与变异概率,为UUV指控任务规划出空间近似最优的路径。指挥员实时监控规划结果,在初始规划完成以后,指挥员确认无误后将规划结果下达到UUV,UUV根据规划结果执行任务。再次,在UUV执行任务期间,因任务环境、任务要素或UUV自身状态等的变化,会面临很多不确定性事件,主要分为三类:海洋环境的不确定性、UUV自身状态的不确定性以及指挥员干预的不确定性。对于不确定事件造成的事件影响、事件的检测识别、事件的威胁评估以及事件的处理方法进行分析研究。UUV指控系统根据事件的威胁程度和影响程度,调用指控任务的时间序列与空间路径规划算法,进行任务的重规划,将规划结果传达到UUV,继续执行任务。最后,基于QT开发环境构建仿真实验平台,给出人在回路的UUV指控任务规划与重规划仿真实验,对上文中UUV指控任务的时间序列规划与空间路径规划进行仿真,验证算法的有效性;然后依据不确定性事件的威胁程度,对指控任务重规划方法进行验证,同时也证明了实验平台的有效性。
冉祥瑞[8](2017)在《基于分层强化学习的AUV路径规划方法研究》文中进行了进一步梳理智能水下机器人(Autonomous Underwater Vehicle,AUV)是探索海洋的重要工具,对海洋开发和海洋资源探索起到了重要的作用,路径规划是智能水下机器人领域的重要技术之一,贯穿了AUV水下航行的始终,是其完成水下作业任务的基础。机器人的智能学习是近年来各个领域的研究热点,本文将分层强化学习方法应用到AUV的路径规划任务中,赋予智能机器人自学习能力,提高AUV的环境自适应性。主要研究以下几点内容:1)深入分析了分层强化学习方法的理论与应用,提出半马尔可夫决策过程,引入抽象的思想进行任务分层以解决强化学习的维数灾问题,基于MAXQ学习算法建立AUV路径规划任务的三层结构,包括:根任务层、子任务选择层、行为动作层,并为每一层设计了相应的决策策略;2)基于分层思想并结合半马尔可夫决策理论对AUV系统进行全局路径规划设计:搭建基于全局路径规划的AUV任务分层结构,建立路径规划任务的评价函数和AUV全局路径规划所需要的各个数学模型,设计了一种全局路径优化的算法弥补了栅格法搜索路径的不足,搭建AUV全局路径规划仿真平台进行仿真试验以验证算法的准确和实用性;3)基于分层强化学习方法设计AUV局部路径规划任务:建立AUV局部路径规划系统模型,为了提升学习效率和降低学习难度,采用CMAC网络来存储每个学习动作的Q值表以优化MAXQ算法,设计局部路径规划分层框架,搭建AUV局部路径规划仿真平台,进行仿真试验,表明分层强化学习提高了AUV的水下环境自适应性。本文将AUV的全局路径规划和局部路径规划结合,提高了AUV水下作业航行的效率;在路径规划模型中加入了海流因素的影响,使环境模型更加贴近于实际;利用自学习的思想,提高AUV在动态复杂海洋环境下的自适应性和自主作业能力;对于AUV安全、可靠、高效自主完成远程航海与地形勘察作业使命,具有重要理论意义及实际应用价值。
毛宇峰[9](2010)在《水下机器人系统体系结构及避障控制技术研究》文中研究指明近年来,随着海洋研究和开发的不断深入以及国防发展的需要,水下机器人所担负的任务也更加多样化,对水下机器人的智能化也提出了更高的要求。水下机器人作为具有人工智能的系统,要能够自主适应外界环境的变化,并自主决策完成操作人员下达的任务。水下机器人系统体系结构是水下机器人研究中非常基础和关键的部分,在水下机器人技术中有着重要的现实意义和实际应用价值。论文研究的目的是建立具有良好通用性的水下机器人系统体系结构,该体系结构适应于完成不同任务的水下机器人。论文以本实验室开发的某型智能水下机器人为研究对象,对水下机器人系统体系结构及动态障碍物感知、避障规划与控制,路径规划及运动控制等相关技术进行了研究。提出了模块化的设计水下机器人混合系统体系结构,明确了各个模块的功能以及模块间的相互关系。采用singer运动模型的Sage? Husa自适应卡尔曼滤波算法的动态障碍物感知方法,在满足感知精度和实时性的同时,而不会给水下机器人系统带来过大的资源消耗。在水下机器人动态避障行为规划方法研究中,提出了在速度矢量坐标下求解期望速度的避障规划方法。通过综合水下机器人运动能力、自身的速度、艏向、动态障碍物的速度、航向以及碰撞时间等多种因素,求解出实现避障的期望速度解集,从而按照最小艏向原则确定期望速度,使水下机器人能够对动态障碍物快速安全避障。对于避障行为的控制,提出了模糊参数自适应有限时间PD控制,该控制器能够根据避障的紧迫程度动态调整系统响应速度,并加入了协调器,减小了艏向和纵向控制的耦合效应,该控制器通过与避障行为规划紧密结合,构成避障规划控制一体化设计。对于复杂海洋环境全局路径规划问题,着重研究粒子群算法在复杂海流环境下的全局路径规划应用中粒子群维度、编码设计、参数选择、拓扑结构的设计方法。对于密集障碍物海流环境全局路径规划问题,提出了采用主干线二叉树搜索算法与粒子群相结合的方法,从而在实现了全局路径基础上,降低了路程花费。对于水下机器人的巡航行为控制,设计了神经网络并行自学习控制器,并成功的进行了海上试验。试验结果表明本文提出的水下机器人系统体系结构可以适应于不同任务需求的水下机器人,各个模块技术实用可靠。本文的研究成果对于各种水下机器人体系结构的建立及相关技术的研究具有一定的现实意义。
曹江丽[10](2009)在《水下机器人路径规划问题的关键技术研究》文中提出自主式水下机器人自主能力的真正含义是具有和外部环境进行交互的能力,这种交互的一个重要方面就是具有全局路径规划以及突发事件下的动态重规划和躲避障碍的能力。要实现水下机器人的自主航行和自主作业,机器人的路径规划是一个重要环节,研究水下机器人的路径规划技术对于提高其智能化水平和加快工程化应用进程具有重要的意义。本文以“十五”国防预研项目(4131607)和“十一五”国防预研项目(51316080202)为背景,对自主式水下机器人在海洋环境下的全局路径规划技术、局部路径规划技术、避碰规划技术、区域探测路径规划技术进行了深入的研究。首先,介绍了水下机器人动力学模型,以及水下机器人的系统组成,概述了水下机器人体系结构的研究现状,并按照精度随智能降低而提高的原理(IPDI)为某型水下机器人设计了分层递阶控制体系结构,它分为六层三列,按照这个体系结构实现的自主控制可以满足任务的需要。提出了海洋环境下的全局路径规划方法。针对海洋环境障碍物分布稀疏的特点,提出了用于小范围区域全局路径规划的最短切线路径算法,它计算简单、运行效率高。针对大范围海洋区域,提出了基于VCF电子海图的多目标优化遗传算法。算法采用可变长的实数坐标的染色体编码方式,在适应度评价函数的设计中综合考虑了多个影响因素,不可行路径被加以惩罚值也参与了种群进化。设计了选择、交叉、变异、修补和删除等五类遗传算子,在生成初始种群和设计遗传算子时引入领域知识,以实现所生成路径尽量不穿越障碍区域的目的,有效地提高了算法的收敛速度。该算法实现了用尽量短的时间在大范围海洋区域规划出一条近似最优路径的研究目标,规划路径合理可行。提出了基于模糊逻辑的局部路径规划方法。在复杂的海洋条件下,导航、传感等数据本身就存在着巨大的不确定性和不准确性,此方法可用来处理这些近似信息。在分析了海流、障碍物和机器人三者之间的关系后,得出相应的模糊规则表作为局部路径规划的依据。该方法综合考虑了海流的影响和机器人平台的运动特性,以相对简单的形式较好地解决了考虑海流影响的水下机器人局部路径规划问题。模糊控制理论用于机器人路径规划同样会出现局部最小问题。提出了基于传感信息的实时路径规划方法,通过设置虚拟目标点以及follow-left-wall行为和follow-right-wall行为的激活和退出条件,使水下机器人能够脱离局部极小状态从而达到目标位置。提出了基于传感信息的反应式行为自动设计方法,将避碰路径规划行为当成一个整体进行设计,不必考虑如何分解行为,采用Q学习对机器人反应式行为进行自主学习,以产生期望的优化行为。学习结束后抽取的控制规则作为反应式行为去执行,这样产生的行为不仅更具目的性和适应性,而且具有反应式行为的较高的反应速度。另外,针对学习系统的输入输出空间是连续变化的要求,提出了一种Fuzzy Q(λ)学习算法,它将模糊理论与Q学习相结合,采用Q(λ学习算法不断更新模糊规则库中的结果向量权值直至其收敛,从而得到一个完整的模糊规则库。提出了基于区域探测作业任务的全覆盖路径规划算法。对基本区域设计了权值梯度法和单元分解法,对含有障碍的一般区域,将整个区域划分为若干个子区域,设计了基于关键点的单元分解策略,针对邻接图构造过程中出现的问题,提出了一种IN/OUT关键点匹配算法,可以保证无遗漏地搜索区域内的所有子区域单元。为跟踪所规划的目标路径,设计了水下机器人的路径跟踪控制策略,综合考虑到任务需要及艇体的运动能力来获得机器人在移动过程中的目标指令。机器人执行区域探测作业任务的仿真试验结果验证了算法的有效性,算法可以满足实际应用的需要。
二、智能水下机器人分层全局路径规划方法研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、智能水下机器人分层全局路径规划方法研究(论文提纲范文)
(1)面向水下自主航行器回收的路径规划研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究的背景和意义 |
1.2 AUV回收研究现状 |
1.2.1 国外现状 |
1.2.2 国内现状 |
1.2.3 AUV回收对接技术发展趋势 |
1.3 路径规划方法研究现状 |
1.3.1 环境表示方法研究现状 |
1.3.2 路径规划算法研究现状 |
1.3.3 AUV路径规划研究趋势 |
1.4 本文主要内容的组织结构安排 |
第二章 AUV回收对接方案分析及环境建模 |
2.1 引言 |
2.2 探海-I型AUV结构设计 |
2.3 AUV回收对接技术要求 |
2.4 AUV回收对接控制方案 |
2.4.1 对接平台方案设计 |
2.4.2 探海-I型AUV回收对接过程 |
2.4.3 AUV回收过程中路径规划整体方案 |
2.5 AUV运动学模型建模 |
2.5.1 AUV坐标系建模 |
2.5.2 AUV运动学建模 |
2.6 环境及障碍物建模 |
2.6.1 静态障碍物模型 |
2.6.2 动态障碍物模型 |
2.6.3 静态海流模型 |
2.7 本章小结 |
第三章 基于飞蛾焰火算法的AUV全局路径规划 |
3.1 引言 |
3.2 飞蛾焰火算法基本原理 |
3.2.1 种群初始化 |
3.2.2 位置更新机制 |
3.3 基于飞蛾焰火算法的静态路径规划 |
3.3.1 初始路径生成 |
3.3.2 适应度函数设计 |
3.3.3 MFO算法路径寻优 |
3.4 仿真实验及分析 |
3.4.1 无海流环境下路径规划 |
3.4.2 海流环境下路径规划 |
3.5 本章小结 |
第四章 基于速度矢量合成的AUV在线路径规划 |
4.1 引言 |
4.2 AUV在线路径规划过程研究 |
4.3 障碍物轨迹预测 |
4.3.1 声呐采样 |
4.3.2 相对坐标系 |
4.3.3 障碍物运动状态估计 |
4.4 速度矢量合成原理 |
4.4.1 障碍物威胁预测 |
4.4.2 期望航向与航速求解 |
4.5 仿真试验及分析 |
4.5.1 障碍物轨迹估计试验 |
4.5.2 单个动目标避碰试验 |
4.5.3 复杂动目标避碰试验 |
4.6 本章小结 |
第五章 基于三维人工势场的末端路径引导 |
5.1 引言 |
5.2 人工势场法原理 |
5.3 改进人工势场法 |
5.4 仿真试验及分析 |
5.5 本章小结 |
第六章 总结与展望 |
参考文献 |
攻读学位期间发表的学术论文 |
致谢 |
(2)海生物抓取捕捞水下机器人运动规划研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题的研究背景及意义 |
1.2 路径规划技术概述 |
1.3 水下机器人路径规划技术 |
1.4 论文的主要研究内容 |
1.5 本文章节的安排 |
第2章 海生物抓取捕捞机器人总体介绍 |
2.1 引言 |
2.2 海生物抓取捕捞机器人介绍 |
2.2.1 机器人运动学建模介绍 |
2.2.2 作业机械手分析 |
2.2.3 机器人总体框架介绍 |
2.2.4 机器人自主作业分析 |
2.3 海生物抓取捕捞机器人规划分析 |
2.4 本章总结 |
第3章 基于深度强化学习的机器人全局搜索规划研究 |
3.1 引言 |
3.2 强化学习理论介绍 |
3.2.1 强化学习的思想及理论基础 |
3.2.2 强化学习算法介绍 |
3.2.3 值迭代网络 |
3.3 作业型水下机器人的全局搜索策略以及问题分解 |
3.3.1 作业型水下机器人的全局规划最优策略 |
3.3.2 作业型水下机器人全局规划的问题分解 |
3.4 未知作业环境下的海生物探知规划 |
3.5 基于聚类算法的海生物分布分析 |
3.5.1 连续环境下的海生物分布聚类分析 |
3.5.2 离散环境下的海生物分布聚类分析 |
3.6 基于粒子群优化算法的全局搜索最优决策模块设计 |
3.6.1 粒子群优化算法介绍 |
3.6.2 全局搜索最优策略的粒子群算法求解 |
3.7 基于值迭代网络的全局搜索避障规划模块设计 |
3.7.1 值迭代网络的训练和仿真 |
3.7.2 算法的对比 |
3.8 作业型机器人全局搜索规划的仿真实验 |
3.9 机器人全局规划水池实验 |
3.9.1 导航系统设计 |
3.9.2 路径跟踪控制器设计 |
3.9.3 全局规划水池实验 |
3.10 本章小结 |
第4章 基于改进RRT算法的机器人局部避障规划研究 |
4.1 引言 |
4.2 RRT算法介绍 |
4.3 RRT算法的分析和改进点 |
4.3.1 算法搜索策略的改进 |
4.3.2 基于目标点偏好的搜索策略 |
4.4 改进后的RRT算法 |
4.4.1 基于排序算法的目标点选择策略 |
4.4.2 基于轮盘赌算法和锦标赛规则的目标点选择策略 |
4.4.3 两个策略的对比 |
4.4.4 路径的平滑策略 |
4.5 算法对比与性能测试 |
4.6 本章小结 |
第5章 基于多目标进化算法的机器人局部抓取规划研究 |
5.1 引言 |
5.2 多目标优化算法介绍 |
5.2.1 多目标优化问题 |
5.2.2 骨干粒子群优化算法 |
5.2.3 约束多目标进化算法 |
5.3 改进约束多目标骨干粒子群优化算法 |
5.3.1 算法改进点 |
5.3.2 算法性能测试及对比 |
5.4 机器人局部抓取数学模型设计 |
5.4.1 机器人局部抓取优化模型设计 |
5.4.2 机器人局部抓取优化模型的数学表达 |
5.5 机器人局部抓取规划仿真实验 |
5.6 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(3)基于强化学习算法的AUV路径规划研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题研究的背景和意义 |
1.2 AUV研究现状 |
1.2.1 国外AUV研究现状 |
1.2.2 国内AUV研究现状 |
1.3 AUV路径规划技术概述 |
1.3.1 路径规划的定义和方法 |
1.3.2 AUV路径规划研究现状 |
1.4 强化学习的研究现状 |
1.5 论文研究的主要内容 |
第2章 强化学习理论 |
2.1 强化学习模型 |
2.1.1 马尔可夫决策过程 |
2.1.2 强化学习的基本原理 |
2.2 强化学习要素 |
2.3 强化学习算法 |
2.3.1 强化学习算法的分类 |
2.3.2 基本的强化学习算法 |
2.4 强化学习应用中的关键问题 |
2.4.1 泛化方法 |
2.4.2 探索与利用的平衡 |
2.5 本章小结 |
第3章 基于Q学习的AUV路径规划 |
3.1 环境信息的获取 |
3.1.1 传感器配置及障碍物的检测 |
3.1.2 AUV在某一时刻的状态描述 |
3.2 基于资格迹的Q学习算法 |
3.3 基于Q学习的AUV路径规划设计 |
3.3.1 环境状态的表示 |
3.3.2 行为动作的划分 |
3.3.3 报酬函数的定义 |
3.3.4 动作选择策略 |
3.4 基于Q学习的AUV路径规划仿真 |
3.4.1 AUV仿真平台简介 |
3.4.2 AUV路径规划流程 |
3.4.3 仿真验证及分析 |
3.5 本章小结 |
第4章 基于深度Q学习的AUV路径规划 |
4.1 深度Q学习的网络结构设计 |
4.1.1 BP神经网络的基本原理 |
4.1.2 深度Q学习的网络结构 |
4.2 基于深度Q学习的AUV路径规划设计 |
4.2.1 AUV深度Q学习系统结构 |
4.2.2 环境状态的表示 |
4.2.3 报酬函数的确定 |
4.3 基于深度Q学习的AUV路径规划仿真 |
4.3.1 AUV路径规划流程 |
4.3.2 仿真验证及分析 |
4.4 本章小节 |
第5章 基于RRT和强化学习的AUV路径规划 |
5.1 RRT算法概述 |
5.1.1 RRT算法的基本原理 |
5.1.2 RRT算法的优点与不足 |
5.2 基于强化学习的改进RRT算法 |
5.2.1 最近邻节点搜索近似 |
5.2.2 RRT算法的MDP模型 |
5.2.3 SRRT算法的描述 |
5.3 路径的平滑处理 |
5.4 仿真验证及分析 |
5.4.1 SRRT算法性能验证 |
5.4.2 基于SRRT算法的AUV三维路径规划 |
5.5 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(4)基于强化学习的AUV行为重规划方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 引言 |
1.2 研究现状 |
1.2.1 传统规划方法 |
1.2.2 智能规划方法 |
1.3 论文主要工作安排 |
第2章 强化学习算法研究 |
2.1 引言 |
2.2 强化学习原理 |
2.2.1 马尔科夫决策过程MDP |
2.2.2 强化学习基本模型 |
2.2.3 强化学习基本算法 |
2.3 分层强化学习算法 |
2.3.1 半马尔科夫决策过程SMDP |
2.3.2 分层强化学习最优策略 |
2.3.3 分层强化学习基本算法 |
2.4 深度强化学习算法 |
2.4.1 深度学习 |
2.4.2 DQN算法 |
2.5 本章小结 |
第3章 基于分层强化学习的全局航路规划 |
3.1 引言 |
3.2 分层强化学习结构设计 |
3.2.1 分层框架设计 |
3.2.2 搜索策略 |
3.2.3 评价函数 |
3.3 全局航路规划模型设计 |
3.3.1 环境状态空间 |
3.3.2 基本动作空间 |
3.3.3 动作选择策略 |
3.3.4 奖惩函数设计 |
3.4 仿真试验 |
3.5 本章小结 |
第4章 基于DQN的行为重规划方法 |
4.1 引言 |
4.2 行为规划体系结构研究 |
4.3 行为重规划系统建模 |
4.3.1 基于DQN的行为重规划系统 |
4.3.2 AUV模型 |
4.3.3 行为动作模型 |
4.3.4 环境状态模型 |
4.3.5 DQN网络构建 |
4.4 趋向目标行为 |
4.4.1 环境状态空间描述 |
4.4.2 奖惩函数设计 |
4.5 墙壁跟踪行为 |
4.5.1 环境状态空间描述 |
4.5.2 奖惩函数设计 |
4.5.3 基于虚拟目标点的跟踪方法 |
4.6 避障行为 |
4.6.1 环境状态空间描述 |
4.6.2 奖惩函数设计 |
4.7 仿真试验 |
4.7.1 趋向目标行为试验 |
4.7.2 墙壁跟踪行为试验 |
4.7.3 避障行为试验 |
4.7.4 综合试验 |
4.8 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(5)水下滑翔机的路径规划研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 水下滑翔机发展进程 |
1.2.1 国外发展进程 |
1.2.2 国内发展进程 |
1.3 水下滑翔机路径规划研究现状 |
1.3.1 国外研究现状 |
1.3.2 国内研究现状 |
1.4 研究现状总结 |
1.5 论文研究内容及章节安排 |
第2章 水下滑翔机路径规划方法与特点 |
2.1 路径规划定义和分类 |
2.1.1 路径规划定义 |
2.1.2 路径规划分类 |
2.2 路径规划方法 |
2.2.1 环境建模方法 |
2.2.2 优化算法 |
2.3 路径规划发展趋势 |
2.4 水下滑翔机路径规划特点 |
2.4.1 与其他水下机器人路径规划的区别 |
2.4.2 海洋环境影响 |
2.4.3 单周期下的路径规划与全局路径规划 |
2.4.4 单目标与多目标优化问题 |
2.5 本章小结 |
第3章 水下滑翔机的能耗分析与路径参数优化 |
3.1 水下滑翔机系统组成 |
3.2 水下滑翔机运动分析 |
3.2.1 水下滑翔机运动过程 |
3.2.2 坐标系定义与定常滑翔受力分析 |
3.2.3 定常滑翔运动参数推导 |
3.3 水下滑翔机能耗分析 |
3.3.1 与滑翔时间有关的能耗 |
3.3.2 与滑翔时间无关的能耗 |
3.3.3 能耗模型修正 |
3.4 水下滑翔机路径参数优化 |
3.4.1 基于单周期能耗最优的路径参数优化 |
3.4.2 基于固定水平滑翔距离下能耗最优的路径参数优化 |
3.5 本章小结 |
第4章 基于改进人工势场法的水下滑翔机避障研究 |
4.1 引言 |
4.2 传统人工势场法原理及缺陷 |
4.2.1 基本思路 |
4.2.2 势场模型 |
4.2.3 传统人工势场法常见缺陷 |
4.3 改进的人工势场法 |
4.3.1 引入目标点的距离因子 |
4.3.2 引入局部引力势场 |
4.3.3 引入速度势场函数 |
4.4 单个周期下水下滑翔机的避障路径规划 |
4.4.1 引入水下滑翔机的运动约束 |
4.4.2 确定障碍物的影响半径 |
4.4.3 考虑海流影响 |
4.4.4 势场参数对路径的影响分析 |
4.4.5 路径规划步骤 |
4.5 仿真试验与分析 |
4.5.1 无海流环境的路径规划 |
4.5.2 常值海流作用下的路径规划 |
4.6 本章小结 |
第5章 基于电子海图的水下滑翔机全局路径规划 |
5.1 引言 |
5.2 利用电子海图进行环境建模 |
5.2.1 电子海图环境信息提取 |
5.2.2 栅格化环境建模 |
5.3 海流模型 |
5.4 基于GA-PSO混合算法的全局路径规划 |
5.4.1 水下滑翔机全局路径规划 |
5.4.2 路径评价函数 |
5.4.3 GA-PSO算法原理及步骤 |
5.5 仿真试验与结果分析 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 论文工作总结 |
6.2 论文创新点 |
6.3 未来工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间已发表或录用的论文 |
(6)基于强化学习的AUV任务规划技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 AUV国内外发展现状 |
1.3 AUV任务规划技术研究进展 |
1.3.1 任务规划的体系结构设计研究进展 |
1.3.2 单目标点航路规划研究进展 |
1.3.3 多目标点航路规划研究进展 |
1.4 AUV任务规划技术存在的问题 |
1.5 本文主要工作 |
第2章 “橙鲨”AUV自学习体系结构设计 |
2.1 体系结构 |
2.2 “橙鲨”AUV传感器及执行器分布 |
2.3 学习监督单元设计及效果仿真 |
2.3.1 学习监督单元设计 |
2.3.2 学习监督单元效果仿真验证 |
2.4 任务分层及重规划单元设计 |
2.5 AUV自学习体系结构整体设计 |
2.6 本章小结 |
第3章 AUV航路规划的自适应Q学习 |
3.1 经典Q学习算法的缺陷 |
3.1.1 Q学习算法原理 |
3.1.2 Q学习算法流程 |
3.1.3 Q学习算法缺陷分析 |
3.2 自适应的动作选择策略研究 |
3.2.1 探索-利用策略理论分析 |
3.2.2 贪心率对AUV航路规划的影响分析 |
3.2.3 环境复杂度评估 |
3.2.4 改进的变贪心率 |
3.2.5 自适应Q学习模型 |
3.3 不同环境下贪心率设置对于航路规划的影响 |
3.3.1 二维环境一 |
3.3.2 二维环境二 |
3.3.3 三维环境 |
3.4 路径优化与平滑 |
3.4.1 去掉多余路径点 |
3.4.2 最佳切入角的航线光滑处理 |
3.4.3 优化后的航线 |
3.5 本章小结 |
第4章 AUV多目标点探测任务 |
4.1 多点探测任务设定 |
4.2 采用Q学习模型的难点分析 |
4.3 分层Q学习航路规划方法研究 |
4.3.1 算法描述 |
4.3.2 目标点到达顺序的确定 |
4.3.3 状态空间的分层 |
4.3.4 子区域内航路规划 |
4.3.5 子区域航路拟合 |
4.4 AUV多目标点探测任务仿真 |
4.4.1 二维环境 |
4.4.2 三维环境 |
4.5 目标点改变时的在线动态重规划 |
4.5.1 目标点改变情况描述 |
4.5.2 在线动态规划解决方案设计 |
4.5.3 仿真实验 |
4.6 本章小结 |
第5章 真实海岛环境的学习模型评估 |
5.1 真实海岛环境的选取 |
5.2 “长岛”环境下自适应Q学习模型评估 |
5.2.1 环境建模 |
5.2.2 参数设置 |
5.2.3 仿真实验 |
5.3 “长海”环境下分层Q学习模型评估 |
5.3.1 环境建模 |
5.3.2 参数设置 |
5.3.3 仿真实验 |
5.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
附录A |
附录B |
附录C |
(7)人在回路的无人水下航行器指控任务规划方法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题研究背景和意义 |
1.2 指控任务规划方法研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 本文研究内容与研究方法 |
1.4 论文的结构安排 |
第2章 人在回路的UUV指控任务要素构成与描述 |
2.1 引言 |
2.2 人在回路的UUV指控任务规划流程设计 |
2.3 基于XML语言的指控任务要素 |
2.3.1 指控任务要素的描述方法 |
2.3.2 XML语言及其特点 |
2.3.3 指控任务要素描述 |
2.3.4 基于XML语言的UUV指控任务要素定义 |
2.4 人在回路中UUV指控任务要素的数据交换 |
2.4.1 XML数据的交换原理 |
2.4.2 XML文档与数据库映射 |
2.4.3 DOM解析 |
2.5 基于XML语言的UUV指控任务典型案例 |
2.6 本章小结 |
第3章 UUV指控任务的时间序列规划与空间路径规划 |
3.1 引言 |
3.2 坐标系定义与环境建模 |
3.2.1 坐标系定义 |
3.2.2 环境建模 |
3.3 UUV指控任务的时间序列规划方法研究 |
3.3.1 基于蚁群优化的UUV指控任务时间序列规划算法设计 |
3.3.2 UUV指控任务时间序列规划的改进蚁群优化算法设计 |
3.3.3 面向多区域勘察任务的UUV指控任务时间序列规划算法仿真验证 |
3.4 UUV指控任务的空间路径规划方法研究 |
3.4.1 UUV空间路径规划问题分析 |
3.4.2 基于遗传进化的UUV指控任务空间路径规划算法设计 |
3.4.3 UUV指控任务空间路径规划算法仿真验证 |
3.5 本章小结 |
第4章 基于不确定事件威胁评估的UUV任务重规划研究 |
4.1 引言 |
4.2 UUV指控任务的不确定性分析 |
4.3 不确定事件检测识别 |
4.4 UUV指控任务重规划的不确定事件威胁评估 |
4.4.1 动态贝叶斯网络 |
4.4.2 动态贝叶斯评估推理机制 |
4.4.3 障碍物不确定出现事件的威胁评估模型 |
4.4.4 不确定事件的触发接口设计 |
4.5 不确定事件的UUV指控任务重规划处理流程设计 |
4.6 指控任务重规划流程设计 |
4.7 本章小结 |
第5章 人在回路的UUV指控任务(重)规划仿真验证 |
5.1 引言 |
5.2 仿真界面设计 |
5.2.1 主窗口界面设计 |
5.2.2 子窗口界面设计 |
5.2.3 人在回路的UUV指控任务(重)规划仿真流程 |
5.3 UUV指控任务(重)规划仿真试验 |
5.3.1 UUV指控任务的时间序列规划仿真 |
5.3.2 UUV指控任务的空间路径规划仿真 |
5.3.3 UUV指控任务规划综合仿真 |
5.3.4 不确定事件下UUV指控任务重规划仿真 |
5.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表论文和取得的科研成果 |
致谢 |
(8)基于分层强化学习的AUV路径规划方法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 AUV路径规划的背景和意义 |
1.2 路径规划技术概述 |
1.3 研究现状 |
1.4 面临的问题和解决方案 |
1.5 本文研究内容 |
第2章 基于强化学习的AUV路径规划分层结构设计 |
2.1 引言 |
2.2 强化学习理论基础 |
2.2.1 强化学习思想 |
2.2.2 马尔可夫决策 |
2.2.3 Q-学习算法 |
2.3 分层强化学习理论 |
2.3.1 半马尔可夫决策过程 |
2.3.2 分层与抽象 |
2.3.3 MAXQ学习方法 |
2.4 AUV路径规划分层框架设计 |
2.4.1 分层原则 |
2.4.2 分层决策策略 |
2.4.4 三个层次设计 |
2.5 本章小结 |
第3章 基于半马尔可夫决策过程的AUV全局路径规划 |
3.1 引言 |
3.2 AUV全局路径规划算法研究 |
3.2.1 搜索策略 |
3.2.2 MAXQ任务分层 |
3.2.3 基于MAXQ算法的评价函数 |
3.3 AUV全局路径规划模型设计 |
3.3.1 环境状态模型 |
3.3.2 行为动作模型 |
3.3.3 奖赏函数模型 |
3.3.4 状态转移函数模型 |
3.3.5 分层结构模型 |
3.4 AUV全局路径规划仿真界面 |
3.5 AUV全局路径规划仿真试验 |
3.5.1 仿真试验算法流程 |
3.5.2 路径优化设计 |
3.5.3 仿真试验 |
3.6 本章小结 |
第4章 基于分层强化学习的AUV局部路径规划 |
4.1 引言 |
4.2 AUV局部路径规划系统建模 |
4.2.1 分层模型 |
4.2.2 机器人传感器模型 |
4.2.3 环境状态模型 |
4.2.4 行为动作模型 |
4.2.5 海流模型 |
4.2.6 层次强化信号模型 |
4.3 AUV局部路径规划算法研究 |
4.3.1 CMAC神经网络原理 |
4.3.2 基于CMAC的MAXQ算法改进 |
4.3.3 AUV局部路径规划算法流程 |
4.4 基于分层强化学习的实时路径规划仿真 |
4.5 不完全探测下的路径规划仿真 |
4.5.1 AUV传感器故障简介 |
4.5.2 传感器故障下的避障机制 |
4.5.3 仿真试验 |
4.6 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(9)水下机器人系统体系结构及避障控制技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 概述 |
1.2 水下机器人的发展概况和研究趋势 |
1.3 水下机器人体系结构研究概述 |
1.4 论文研究背景和意义 |
1.5 论文主要内容 |
第2章 水下机器人混合体系结构设计 |
2.1 引言 |
2.2 体系结构研究概述 |
2.2.1 分层递阶体系结构 |
2.2.2 反应式体系结构 |
2.2.3 混合体系结构 |
2.3 水下机器人混合体系结构设计 |
2.3.1 任务管理器 |
2.3.2 感知器 |
2.3.3 行为管理器 |
2.4 仿真研究 |
2.5 本章小结 |
第3章 水下机器人动态障碍物感知技术 |
3.1 引言 |
3.2 目标运动模型 |
3.2.1 CV 模型 |
3.2.2 CA 模型 |
3.2.3 Singer 模型 |
3.3 卡尔曼滤波 |
3.3.1 离散型卡尔曼滤波 |
3.3.2 自适应卡尔曼滤波 |
3.4 仿真试验研究 |
3.5 本章小结 |
第4章 水下机器人避障行为规划及控制 |
4.1 引言 |
4.2 水下机器人避障规划算法 |
4.2.1 问题描述 |
4.2.2 大地坐标系与艇体坐标系 |
4.2.3 声呐数据与障碍物描述 |
4.2.4 碰撞预测模型 |
4.2.5 速度矢量坐标系内AUV 期望速度求解 |
4.2.6 避障策略 |
4.2.7 仿真研究 |
4.3 基于避障行为的水下机器人有限时间模糊PD 控制 |
4.3.1 有限时间控制基本概念 |
4.3.2 有限时间 PD 控制器在水下机器人控制中的应用 |
4.3.3 仿真试验结果分析 |
4.4 模糊参数自适应有限时间PD 控制器 |
4.4.1 模糊自适应有限时间 PD 控制器设计 |
4.4.2 纵向与艏向控制协调器设计 |
4.4.3 仿真试验结果 |
4.5 本章小结 |
第5章 水下机器人全局路径规划技术 |
5.1 引言 |
5.2 水下机器人全局路径规划概述 |
5.3 粒子群算法 |
5.3.1 粒子群算法概述 |
5.3.2 基本 PSO 算法 |
5.3.3 PSO 算法的改进 |
5.4 粒子群算法在水下机器人全局路径规划的应用 |
5.4.1 海洋环境表达 |
5.4.2 PSO 算法路径规划的实现 |
5.4.3 仿真试验结果与分析 |
5.5 多障碍物海洋环境中粒子群优化全局路径规划 |
5.5.1 主干线二叉树法 |
5.5.2 A*算法路径搜索 |
5.5.3 PSO 算法路径优化的实现 |
5.5.4 仿真实验及结果分析 |
5.6 本章小结 |
第6章 水下机器人基础运动控制器 |
6.1 引言 |
6.2 控制问题描述 |
6.3 神经网络并行自学习控制器设计 |
6.3.1 控制器结构及工作原理 |
6.3.2 自适应神经网络模型(ANNM )及其训练 |
6.3.3 神经网络控制器(NNC)及其训练 |
6.3.4 运行监控器 |
6.3.5 鲁棒控制器 |
6.4 神经网络并行自学习控制器的水下机器人控制应用 |
6.4.1 水下机器人的动力学辨识 |
6.4.2 目标规划器 |
6.4.3 水下机器人的运动控制 |
6.5 海上试验结果 |
6.6 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文和取得的科研成果 |
致谢 |
(10)水下机器人路径规划问题的关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 水下机器人研究现状 |
1.3 路径规划技术研究概况 |
1.4 路径规划技术发展趋势 |
1.5 论文研究内容 |
第二章 水下机器人系统 |
2.1 水下机器人动力学模型 |
2.2 水下机器人系统组成 |
2.3 体系结构 |
2.3.1 水下机器人体系结构研究概况 |
2.3.2 分层递阶控制体系结构 |
2.4 本章小结 |
第三章 水下机器人全局路径规划技术 |
3.1 几种典型的路径规划方法 |
3.2 用于小范围区域规划的最短切线路径算法 |
3.3 基于矢量数字海图的大范围全局路径规划 |
3.3.1 VCF电子海图浏览器 |
3.3.2 环境模型 |
3.3.3 基于VCF电子海图的多目标优化遗传算法 |
3.3.3.1 路径的编码 |
3.3.3.2 路径的适应度评价函数 |
3.3.3.3 初始种群的产生 |
3.3.3.4 基于知识的遗传算子 |
3.3.3.5 种群置换方法 |
3.3.4 算法实验 |
3.4 本章小结 |
第四章 基于模糊逻辑的局部路径规划技术 |
4.1 考虑海流影响的局部路径规划 |
4.1.1 海流对水下机器人运动的影响 |
4.1.2 基于模糊逻辑的路径规划方法 |
4.1.3 仿真实验 |
4.2 基于传感信息的实时路径规划 |
4.2.1 模糊控制路径规划策略 |
4.2.2 陷阱问题的解决策略 |
4.3 本章小结 |
第五章 基于Q学习算法的水下机器人避碰规划 |
5.1 引言 |
5.2 强化学习 |
5.2.1 强化学习的结构模型 |
5.2.2 强化学习算法 |
5.3 Q学习 |
5.3.1 Q学习算法 |
5.3.2 Q学习中的探索策略 |
5.4 基于Q学习算法的避碰规划学习系统设计 |
5.4.1 环境信息的获取 |
5.4.2 输入状态空间及输出动作空间的离散化表示 |
5.4.3 强化信号的计算 |
5.4.4 动作选择策略 |
5.4.5 基于Q学习算法的避碰规划学习 |
5.4.6 仿真试验 |
5.5 针对连续输入输出空间的Fuzzy Q(λ)算法 |
5.5.1 Fuzzy Q(λ)算法 |
5.5.2 机器人避碰规划的Fuzzy Q(λ)学习算法实现 |
5.6 本章小结 |
第六章 基于区域探测任务的路径规划技术 |
6.1 基本区域的全局路径规划 |
6.1.1 权值梯度法 |
6.1.2 单元分解法 |
6.2 一般区域的全局路径规划 |
6.2.1 基于关键点的单元分解策略 |
6.2.2 邻接图的构造 |
6.2.3 子区域的覆盖 |
6.2.4 子区域的切换 |
6.3 路径跟踪控制策略 |
6.4 仿真试验 |
6.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文和取得的科研成果 |
致谢 |
四、智能水下机器人分层全局路径规划方法研究(论文参考文献)
- [1]面向水下自主航行器回收的路径规划研究[D]. 徐炜翔. 江苏科技大学, 2020(03)
- [2]海生物抓取捕捞水下机器人运动规划研究[D]. 徐杨. 哈尔滨工程大学, 2020(04)
- [3]基于强化学习算法的AUV路径规划研究[D]. 武凯凯. 哈尔滨工程大学, 2020(05)
- [4]基于强化学习的AUV行为重规划方法研究[D]. 王力锋. 哈尔滨工程大学, 2019(03)
- [5]水下滑翔机的路径规划研究[D]. 李沛伦. 上海交通大学, 2019(06)
- [6]基于强化学习的AUV任务规划技术研究[D]. 代长安. 哈尔滨工程大学, 2019(03)
- [7]人在回路的无人水下航行器指控任务规划方法研究[D]. 张倩倩. 哈尔滨工程大学, 2019(05)
- [8]基于分层强化学习的AUV路径规划方法研究[D]. 冉祥瑞. 哈尔滨工程大学, 2017(08)
- [9]水下机器人系统体系结构及避障控制技术研究[D]. 毛宇峰. 哈尔滨工程大学, 2010(08)
- [10]水下机器人路径规划问题的关键技术研究[D]. 曹江丽. 哈尔滨工程大学, 2009(02)