您的位置: 专家智库 > >

中国博士后科学基金(200902483)

作品数:2 被引量:3H指数:1
相关作者:陈鑫吴敏袁姣红戴朝晖更多>>
相关机构:中南大学更多>>
发文基金:中国博士后科学基金国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...

主题

  • 2篇智能体
  • 1篇智能体系统
  • 1篇多智能
  • 1篇多智能体
  • 1篇多智能体系
  • 1篇多智能体系统
  • 1篇高斯
  • 1篇贝叶斯
  • 1篇贝叶斯学习

机构

  • 2篇中南大学

作者

  • 1篇戴朝晖
  • 1篇袁姣红
  • 1篇吴敏
  • 1篇陈鑫

传媒

  • 1篇控制理论与应...

年份

  • 1篇2012
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
基于概率模型的动态分层强化学习被引量:2
2011年
为解决大规模强化学习中的"维度灾难"问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层强化学习方法.首先基于贝叶斯学习对状态转移概率进行建模,建立基于概率参数的关键状态识别方法,进而通过聚类动态生成若干状态子空间和学习分层结构下的最优策略.仿真结果表明该算法能显著提高复杂环境下智能体的学习效率,适用于未知环境中的大规模学习.
戴朝晖袁姣红吴敏陈鑫
关键词:贝叶斯学习智能体
基于高斯回归的连续空间多智能体最佳响应策略学习
在多智能体的实际应用环境中,泛化往往是多智能体策略学习算法应用于连续状态空间需要解决的关键问题之一本文提出一种基于高斯回归的连续空间多智能体最佳响应策略学习算法该算法通过定义降维的Q函数强调学习智能体对其它智能体策略的适...
魏海军陈鑫吴敏曹卫华
关键词:多智能体系统
文献传递
共1页<1>
聚类工具0