Shortcuts

DI-engine 简介

了解 DI-engine

DI-engine 是由一群充满活力的研究员和工程师打造的开源决策智能平台,它将为您的强化学习算法研究和开发工作提供最专业最便捷的帮助,主要包括:

  1. 完整的算法支持,例如 DQN,PPO,SAC 以及许多研究子领域的相关算法——多智能体强化学习中的 QMIX,逆强化学习中的 GAIL,探索问题中的 RND 等等。

  2. 友好的用户接口,我们抽象了强化学习任务中的大部分常见对象,例如环境,策略,并将复杂的强化学习流程封装成丰富的中间件,让您随心所欲的构建自己的学习流程。

  3. 弹性的拓展能力,利用框架内集成的消息组件和事件编程接口,您可以灵活的将基础研究工作拓展到工业级大规模训练集群中,例如星际争霸智能体 DI-star

../_images/system_layer.png

核心概念

假如您尚未了解强化学习,可以转至我们的 强化学习教程 一窥强化学习的奇妙世界。

假如您已经接触过强化学习,想必已经非常了解强化学习的基本交互对象: 环境智能体(或者构成智能体的策略)

DI-engine 没有创造更多的概念,而是将这两者之间复杂的交互逻辑抽象成了声明式的中间件,例如 采集数据(collect)训练模型(train)评估模型(evaluate)保存模型(save_ckpt), 您可以依据最自然的方式调整流程中的各个环节。

使用 DI-engine 将会非常简单,在 快速开始 部分,我们将通过一个简单的例子向您介绍,如何使用 DI-engine 快速搭建一个经典的强化学习流程。