DI-engine 简介 =============================== 了解 DI-engine ------------------------------- DI-engine 是由一群充满活力的研究员和工程师打造的开源决策智能平台,它将为您的强化学习算法研究和开发工作提供最专业最便捷的帮助,主要包括: 1. 完整的算法支持,例如 DQN,PPO,SAC 以及许多研究子领域的相关算法——多智能体强化学习中的 QMIX,逆强化学习中的 GAIL,探索问题中的 RND 等等。 2. 友好的用户接口,我们抽象了强化学习任务中的大部分常见对象,例如环境,策略,并将复杂的强化学习流程封装成丰富的中间件,让您随心所欲的构建自己的学习流程。 3. 弹性的拓展能力,利用框架内集成的消息组件和事件编程接口,您可以灵活的将基础研究工作拓展到工业级大规模训练集群中,例如星际争霸智能体 `DI-star `_。 .. image:: ../images/system_layer.png 核心概念 ------------------------------- 假如您尚未了解强化学习,可以转至我们的 `强化学习教程 <../10_concepts/index_zh.html>`_ 一窥强化学习的奇妙世界。 假如您已经接触过强化学习,想必已经非常了解强化学习的基本交互对象: **环境** 和 **智能体(或者构成智能体的策略)**。 DI-engine 没有创造更多的概念,而是将这两者之间复杂的交互逻辑抽象成了声明式的中间件,例如 **采集数据(collect)**,**训练模型(train)**,**评估模型(evaluate)**,**保存模型(save_ckpt)**, 您可以依据最自然的方式调整流程中的各个环节。 使用 DI-engine 将会非常简单,在 `快速开始 <../01_quickstart/index_zh.html>`_ 部分,我们将通过一个简单的例子向您介绍,如何使用 DI-engine 快速搭建一个经典的强化学习流程。