Table of Contents

Shortcuts

强化学习算法¶

在此页面中，您可以找到当前在 DI-engine中实现的算法。与我们的算法相关的所有页面都遵循以下结构：

概述
快速了解
重要公示/重要图示
伪代码
扩展
实现
实现 Benchmark
参考文献

基于价值的强化学习（Value-Based RL）

DQN
Rainbow
C51
QRDQN
IQN
- 概述
- 要点摘要：
- 关键方程
- 关键图
- 扩展
- 实现
- 基准
- 参考文献
- 其他开源实现
FQF
SQL
MDQN

演员—评委（Actor-Critic）

PPG
- 概述
- 核心要点
- 重要图示
- 重要公式
- 伪代码
- 扩展
- 实现
- Benchmark
- 引用
- 其他开源实现
DDPG
TD3

多智能体强化学习

模仿学习

基于模型的强化学习（Model-Based RL）

MBPO

泛化

PLR