相关推荐

浏览器版本过低,请升级浏览器
收藏

莫烦 #8 什么是 Deep Deterministic Policy Gradient (DDPG)(Reinforcement Learning 强化学习)原创

莫烦Python
1.9万 粉丝
详情
2017-04-08 13:06:53上传
今天我们会来说说强化学习中的一种actor critic 的提升方式 Deep Deterministic Policy Gradient (DDPG), DDPG 最大的优势就是能够在连续动作上更有效地学习. 详细的文字教程: https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/ Code in Github: https://github.com/MorvanZhou/tutorials/tree/master/Reinforcement_learning_TUT

评论区