DI-engine 简介¶

了解 DI-engine¶

DI-engine 是由一群充满活力的研究员和工程师打造的开源决策智能平台，它将为您的强化学习算法研究和开发工作提供最专业最便捷的帮助，主要包括：

完整的算法支持，例如 DQN，PPO，SAC 以及许多研究子领域的相关算法——多智能体强化学习中的 QMIX，逆强化学习中的 GAIL，探索问题中的 RND 等等。
友好的用户接口，我们抽象了强化学习任务中的大部分常见对象，例如环境，策略，并将复杂的强化学习流程封装成丰富的中间件，让您随心所欲的构建自己的学习流程。
弹性的拓展能力，利用框架内集成的消息组件和事件编程接口，您可以灵活的将基础研究工作拓展到工业级大规模训练集群中，例如星际争霸智能体 DI-star。

假如您尚未了解强化学习，可以转至我们的强化学习教程一窥强化学习的奇妙世界。

假如您已经接触过强化学习，想必已经非常了解强化学习的基本交互对象：环境和 智能体（或者构成智能体的策略）。

DI-engine 没有创造更多的概念，而是将这两者之间复杂的交互逻辑抽象成了声明式的中间件，例如 采集数据（collect），训练模型（train），评估模型（evaluate），保存模型（save_ckpt），您可以依据最自然的方式调整流程中的各个环节。

使用 DI-engine 将会非常简单，在快速开始部分，我们将通过一个简单的例子向您介绍，如何使用 DI-engine 快速搭建一个经典的强化学习流程。