您的位置: 专家智库 > >

文献类型

  • 4篇中文专利

领域

  • 1篇文化科学

主题

  • 4篇制导
  • 4篇制导方法
  • 2篇学习算法
  • 2篇强化学习算法
  • 2篇最大熵
  • 2篇向量
  • 2篇向量组
  • 2篇决策过程
  • 2篇滑模
  • 2篇滑模面
  • 2篇观测器
  • 2篇飞行
  • 2篇飞行器
  • 2篇干扰观测器
  • 1篇控制系统
  • 1篇飞行器控制
  • 1篇飞行器控制系...

机构

  • 4篇南开大学

作者

  • 4篇董飞
  • 4篇张晓宇
  • 2篇檀盼龙

年份

  • 2篇2025
  • 2篇2024
5 条 记 录,以下是 1-4
排序方式:
基于最大熵强化学习算法的模型训练方法及规划制导方法
本发明提供一种基于最大熵强化学习算法的模型训练方法及规划制导方法,包括:构建动作评论模型,动作评论模型包括行动网络模块和评论网络模块;动作评论模型根据状态向量得到决策过程向量组,状态向量为从预设环境中得到的;根据决策过程...
张晓宇王晨飞刘烨坤董飞
一种飞行器末段预定时间滑模制导方法
本发明涉及非电变量的控制或调节技术领域,尤其涉及一种飞行器末段预定时间滑模制导方法,包括如下步骤:建立三维耦合相对运动模型;使<Image file="ZY_1.GIF" he="78" imgContent="draw...
张晓宇刘烨坤檀盼龙董飞
基于最大熵强化学习算法的模型训练方法及规划制导方法
本发明提供一种基于最大熵强化学习算法的模型训练方法及规划制导方法,包括:构建动作评论模型,动作评论模型包括行动网络模块和评论网络模块;动作评论模型根据状态向量得到决策过程向量组,状态向量为从预设环境中得到的;根据决策过程...
张晓宇 王晨飞 刘烨坤董飞
一种飞行器末段预定时间滑模制导方法
本发明涉及非电变量的控制或调节技术领域,尤其涉及一种飞行器末段预定时间滑模制导方法,包括如下步骤:建立三维耦合相对运动模型;使<IMG width="62" orientation="portrait" inline="...
张晓宇刘烨坤檀盼龙董飞
共1页<1>
聚类工具0