强化学习算法¶ 在此页面中,您可以找到当前在 DI-engine中实现的算法。 与我们的算法相关的所有页面都遵循以下结构: 概述 快速了解 重要公示/重要图示 伪代码 扩展 实现 实现 Benchmark 参考文献 基于价值的强化学习(Value-Based RL) DQN 综述 快速了解 重要公示/重要图示 伪代码 扩展 实现 实验 Benchmark 参考文献 Rainbow 概述 要点摘要 关键方程或关键图表 扩展 实现 基准 关于Rainbow算法的实验技巧 参考文献 C51 概述 核心要点 伪代码 关键方程或关键框图 扩展 实现 基准测试 其他开源实现 QRDQN 概述 核心要点 关键方程或关键框图 伪代码 扩展 实现 基准 参考文献 其他开源实现 IQN 概述 要点摘要: 关键方程 关键图 扩展 实现 基准 参考文献 其他开源实现 FQF 概述 核心要点 关键方程或关键框图 伪代码 扩展 实现 基准测试 参考文献 其他开源实现 SQL 概述 要点摘要 关键方程或关键图表 伪代码 扩展 实现 基准 参考文献 其他开源的实现 MDQN 概述 核心要点 关键方程或关键框图 伪代码 扩展 实现 实验 Benchmark 参考文献 演员—评委(Actor-Critic) PPG 概述 核心要点 重要图示 重要公式 伪代码 扩展 实现 Benchmark 引用 其他开源实现 DDPG 概述 核心要点 关键方程或关键框图 伪代码 扩展 实现 基准 参考 其他公开的实现 TD3 概述 核心要点 关键方程或关键框图 伪代码 扩展 实现 基准 参考文献 其他公开的实现 多智能体强化学习 QMIX 概述 核心要点 关键方程或关键图形 实现 Benchmark 引用 其他开源实现 HAPPO 概述 核心要点 关键方程或关键图形 算法伪代码 实现 Benchmark 引用 其他开源实现 探索 ICM 概述 核心要点 关键方程或关键框图 重要实现细节 实现 实验结果 参考资料 NGU 概述 核心要点 关键方程或关键框图 伪代码 重要的实现细节 实现 基准算法性能 参考资料 DIAYN 概述 核心要点 关键方程或关键框图 伪代码 实现 基准算法性能 参考资料 模仿学习 Guided Cost Learning 综述 快速了解 重要公示/重要图示 伪代码 扩展 实现 实验 Benchmark 参考文献 R2D3 概述 核心要点 离线强化学习 CQL 综述 快速了解 重要公式/重要图示 伪代码 实现 Benchmark 引用 其他开源实现 EDAC 综述 快速了解 重要公式/重要图示 伪代码 实现 Benchmark 参考文献 其他公开实现 DT (DecisionTransformer) 综述 快速了解 重要公示/重要图示 伪代码 实现 实验 Benchmark 参考文献 QGPO 概述 核心要点 关键方程或关键框图 实现 Benchmark 引用 其他开源实现 基于模型的强化学习(Model-Based RL) MBPO 概述 核心要点 关键方程或关键框图 伪代码 实现 基准 其他公开的实现 参考文献 泛化 PLR 概述 核心要点 关键框图 关键方程 伪代码 基准测试 参考文献 其他开源实现