公共文化服务平台

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

多智能体合作环境下的分布式强化学习: 针对多智能体完全合作环境下学习速度慢及收敛效果不佳问题,提出了基于分布式强化学习的二阶段适应学习方法,依次实现了智能体对环境的适应以及系统内部的协作.在第一阶段,智能体间的强化学习相互独立,以快速适应状态空间环境为主;该...; 傅波陈鑫何勇吴敏; 关键词：多智能体系统精度控制; 文献传递

多智能体合作环境下的分布式强化学习: 2013年; 针对多智能体完全合作环境下学习速度慢及收敛效果不佳问题,提出了基于分布式强化学习的二阶段适应学习方法,依次实现了智能体对环境的适应以及系统内部的协作.在第一阶段,智能体间的强化学习相互独立,以快速适应状态空间环境为主;该阶段中引入对环境的适应性因子,当智能体学习的误差小于该值时,智能体达到了对坏境的较高适应度.第二阶段中智能体采用不同的学习率进行交替适应学习,经过智能体间学习率的调整,实现了智能体学习系统中慢者与快者间的适应,最终形成协作直至收敛.与经典算法仿真结果的比较表明了二阶段适应性学习算法的可行性与高效性.; 傅波陈鑫何勇吴敏; 关键词：多智能体系统分布式学习适应性

全选清除导出

共1页<1>

傅波