Logo
latest

用户文档

  • 介绍
  • 安装
  • 算法
  • 运行试验
  • 试验输出
  • 绘制结果

强化学习介绍

  • 第一部分:强化学习中的核心概念
  • 第二部分:强化学习算法
  • 第三部分:策略优化介绍

资源

  • 深度强化学习研究者资料
  • 深度强化学习的核心论文
  • 练习
  • Spinning Up 算法实现的基准

算法文档

  • Vanilla Policy Gradient
  • Trust Region Policy Optimization
  • Proximal Policy Optimization
  • Deep Deterministic Policy Gradient
  • Twin Delayed DDPG
  • Soft Actor-Critic

工具文档

  • 日志记录
  • 绘图
  • MPI工具
  • 运行工具

其他

  • 致谢
  • 关于作者
Spinning Up
  • Docs »
  • 概览:模块代码

代码可用的所有模块

  • spinup.algos.ddpg.ddpg
  • spinup.algos.ppo.ppo
  • spinup.algos.sac.sac
  • spinup.algos.td3.td3
  • spinup.algos.trpo.trpo
  • spinup.algos.vpg.vpg
  • spinup.utils.logx
  • spinup.utils.mpi_tf
  • spinup.utils.mpi_tools
  • spinup.utils.run_utils

© Copyright 2018, OpenAI. Revision a8dd22ce.

Built with Sphinx using a theme provided by Read the Docs.
Read the Docs v: latest
Versions
latest
stable
Downloads
html
epub
On Read the Docs
Project Home
Builds

Free document hosting provided by Read the Docs.