您的位置: 专家智库 > >

广西工学院博士基金(200304)

作品数:1 被引量:2H指数:1
相关作者:李春贵陈波更多>>
相关机构:广西科技大学更多>>
发文基金:广西省自然科学基金广西工学院博士基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇Q学习
  • 1篇MARKOV...

机构

  • 1篇广西科技大学

作者

  • 1篇陈波
  • 1篇李春贵

传媒

  • 1篇计算机工程与...

年份

  • 1篇2006
1 条 记 录,以下是 1-1
排序方式:
强化学习中的混合探索方案被引量:2
2006年
对强化学习中的探索方案进行了研究,描述了间接探索和直接探索两种方案各自的特点。综合它们的优点,提出了一种集直接探索和间接探索为一体的混合探索方案。该方案在学习的初始阶段,由于对环境的经验知识较少,侧重于直接探索;在获得比较多的经验后,侧重于间接探索,使得行动选择渐渐趋向于最优策略。实验表明该方案比纯粹的间接探索-greedy方案有更高的学习效率。
李春贵陈波
关键词:MARKOV决策过程Q学习
共1页<1>
聚类工具0