latest

用户文档

介绍
安装
算法
运行试验
试验输出
绘制结果

强化学习介绍

第一部分：强化学习中的核心概念
第二部分：强化学习算法
第三部分：策略优化介绍

资源

深度强化学习研究者资料
深度强化学习的核心论文
练习
Spinning Up 算法实现的基准

算法文档

Vanilla Policy Gradient
Trust Region Policy Optimization
Proximal Policy Optimization
Deep Deterministic Policy Gradient
Twin Delayed DDPG
Soft Actor-Critic

工具文档

日志记录
绘图
MPI工具
运行工具

其他

致谢
关于作者

Spinning Up

Docs »
深度强化学习 Spinning Up 项目中文版
Edit on GitHub

深度强化学习 Spinning Up 项目中文版¶

_images/spinning-up-in-rl.png

用户文档

介绍
安装
算法
运行试验
- 从命令行启动
- 从脚本启动
试验输出
绘制结果

强化学习介绍

第一部分：强化学习中的核心概念
第二部分：强化学习算法
- 强化学习算法分类
- 分类中提到的算法链接
第三部分：策略优化介绍

资源

深度强化学习研究者资料
深度强化学习的核心论文
练习
Spinning Up 算法实现的基准
- 每个环境中的性能
- 实验细节

算法文档

Vanilla Policy Gradient
- 背景
- 文档
- 参考
Trust Region Policy Optimization
- 背景
- 文档
- 参考
Proximal Policy Optimization
- 背景
- 文档
- 参考
Deep Deterministic Policy Gradient
- 背景
- 文档
- 参考
Twin Delayed DDPG
- 背景
- 文档
- 参考
Soft Actor-Critic
- 背景
- 文档
- 参考

工具文档

日志记录
绘图
MPI工具
- 核心MPI工具
- MPI + Tensorflow 工具
运行工具
- ExperimentGrid
- 运行实验

其他

致谢
关于作者

索引和目录¶

索引
模块索引
搜索页面

Next

© Copyright 2018, OpenAI. Revision a8dd22ce.

Built with Sphinx using a theme provided by Read the Docs.