相关推荐

浏览器版本过低,请升级浏览器
收藏

莫烦 #8 什么是 Actor Critic (Reinforcement Learning 强化学习)原创

莫烦Python
1.9万 粉丝
详情
2017-03-17 14:06:07上传
今天我们会来说说强化学习中的一种结合体 Actor Critic (演员评判家), 它合并了 以值为基础 (比如 Q learning) 和 以动作概率为基础 (比如 Policy Gradients) 两类强化学习算法. 详细的文字教程: https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/ Code in Github: https://github.com/MorvanZhou/tutorials/tree/master/Reinforcement_learning_TUT

评论区