相关推荐

浏览器版本过低,请升级浏览器
收藏

莫烦 #17 A3C (强化学习 Reinforcement Learning 教学)原创

莫烦Python
1.9万 粉丝
详情
2017-05-03 11:38:39上传
Google DeepMind 提出的一种解决 Actor-Critic 不收敛问题的算法. 它会创建多个并行的环境, 让多个拥有副结构的 agent 同时在这些并行环境上更新主结构中的参数. 并行中的 agent 们互不干扰, 而主结构的参数更新受到副结构提交更新的不连续性干扰, 所以更新的相关性被降低, 收敛性提高. 详细的文字教程: https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/ Code in Github: https://github.com/MorvanZhou/tutorials/tree/master/Reinforcement_learning_TUT

评论区