latest

用户文档

介绍
安装
算法
运行试验
试验输出
绘制结果

强化学习介绍

第一部分：强化学习中的核心概念
第二部分：强化学习算法
第三部分：策略优化介绍

资源

深度强化学习研究者资料
深度强化学习的核心论文
练习
Spinning Up 算法实现的基准

算法文档

Vanilla Policy Gradient
Trust Region Policy Optimization
Proximal Policy Optimization
Deep Deterministic Policy Gradient
Twin Delayed DDPG
Soft Actor-Critic

工具文档

日志记录
绘图
MPI工具
运行工具

其他

致谢
关于作者

Spinning Up

Docs »
概览：模块代码

代码可用的所有模块

spinup.algos.ddpg.ddpg
spinup.algos.ppo.ppo
spinup.algos.sac.sac
spinup.algos.td3.td3
spinup.algos.trpo.trpo
spinup.algos.vpg.vpg
spinup.utils.logx
spinup.utils.mpi_tf
spinup.utils.mpi_tools
spinup.utils.run_utils

© Copyright 2018, OpenAI. Revision a8dd22ce.

Built with Sphinx using a theme provided by Read the Docs.

Read the Docs v: latest

Versions: latest; stable

Downloads: html; epub

On Read the Docs: Project Home; Builds

Free document hosting provided by Read the Docs.