傅波
- 作品数:2 被引量:0H指数:0
- 供职机构:中南大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 多智能体合作环境下的分布式强化学习
- 针对多智能体完全合作环境下学习速度慢及收敛效果不佳问题,提出了基于分布式强化学习的二阶段适应学习方法,依次实现了智能体对环境的适应以及系统内部的协作.在第一阶段,智能体间的强化学习相互独立,以快速适应状态空间环境为主;该...
- 傅波陈鑫何勇吴敏
- 关键词:多智能体系统精度控制
- 文献传递
- 多智能体合作环境下的分布式强化学习
- 2013年
- 针对多智能体完全合作环境下学习速度慢及收敛效果不佳问题,提出了基于分布式强化学习的二阶段适应学习方法,依次实现了智能体对环境的适应以及系统内部的协作.在第一阶段,智能体间的强化学习相互独立,以快速适应状态空间环境为主;该阶段中引入对环境的适应性因子,当智能体学习的误差小于该值时,智能体达到了对坏境的较高适应度.第二阶段中智能体采用不同的学习率进行交替适应学习,经过智能体间学习率的调整,实现了智能体学习系统中慢者与快者间的适应,最终形成协作直至收敛.与经典算法仿真结果的比较表明了二阶段适应性学习算法的可行性与高效性.
- 傅波陈鑫何勇吴敏
- 关键词:多智能体系统分布式学习适应性