强化学习算法 ~~~~~~~~~~~~~~~~~~~~~~~~~~ 在此页面中,您可以找到当前在 DI-engine中实现的算法。 与我们的算法相关的所有页面都遵循以下结构: - 概述 - 快速了解 - 重要公示/重要图示 - 伪代码 - 扩展 - 实现 - 实现 Benchmark - 参考文献 .. toctree:: :maxdepth: 2 :caption: 基于价值的强化学习(Value-Based RL) dqn_zh rainbow_zh c51_zh qrdqn_zh iqn_zh fqf_zh sql_zh mdqn_zh .. toctree:: :maxdepth: 2 :caption: 演员—评委(Actor-Critic) ppg_zh ddpg_zh td3_zh .. toctree:: :maxdepth: 2 :caption: 多智能体强化学习 qmix_zh happo_zh .. toctree:: :maxdepth: 2 :caption: 探索 icm_zh ngu_zh diayn_zh .. toctree:: :maxdepth: 2 :caption: 模仿学习 guided_cost_zh r2d3_zh .. toctree:: :maxdepth: 2 :caption: 离线强化学习 cql_zh edac_zh dt_zh qgpo_zh .. toctree:: :maxdepth: 2 :caption: 基于模型的强化学习(Model-Based RL) mbpo_zh .. toctree:: :maxdepth: 2 :caption: 泛化 plr_zh