2025年12月6日
星期六
|
欢迎来到三亚市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
中国博士后科学基金(200902483)
作品数:
2
被引量:3
H指数:1
相关作者:
陈鑫
吴敏
袁姣红
戴朝晖
更多>>
相关机构:
中南大学
更多>>
发文基金:
中国博士后科学基金
国家教育部博士点基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
相关作品
相关人物
相关机构
相关资助
相关领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
会议论文
领域
2篇
自动化与计算...
主题
2篇
智能体
1篇
智能体系统
1篇
多智能
1篇
多智能体
1篇
多智能体系
1篇
多智能体系统
1篇
高斯
1篇
贝叶斯
1篇
贝叶斯学习
机构
2篇
中南大学
作者
1篇
戴朝晖
1篇
袁姣红
1篇
吴敏
1篇
陈鑫
传媒
1篇
控制理论与应...
年份
1篇
2012
1篇
2011
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于概率模型的动态分层强化学习
被引量:2
2011年
为解决大规模强化学习中的"维度灾难"问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层强化学习方法.首先基于贝叶斯学习对状态转移概率进行建模,建立基于概率参数的关键状态识别方法,进而通过聚类动态生成若干状态子空间和学习分层结构下的最优策略.仿真结果表明该算法能显著提高复杂环境下智能体的学习效率,适用于未知环境中的大规模学习.
戴朝晖
袁姣红
吴敏
陈鑫
关键词:
贝叶斯学习
智能体
基于高斯回归的连续空间多智能体最佳响应策略学习
在多智能体的实际应用环境中,泛化往往是多智能体策略学习算法应用于连续状态空间需要解决的关键问题之一本文提出一种基于高斯回归的连续空间多智能体最佳响应策略学习算法该算法通过定义降维的Q函数强调学习智能体对其它智能体策略的适...
魏海军
陈鑫
吴敏
曹卫华
关键词:
多智能体系统
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张