DI-engine 简介¶
了解 DI-engine¶
DI-engine 是由一群充满活力的研究员和工程师打造的开源决策智能平台,它将为您的强化学习算法研究和开发工作提供最专业最便捷的帮助,主要包括:
完整的算法支持,例如 DQN,PPO,SAC 以及许多研究子领域的相关算法——多智能体强化学习中的 QMIX,逆强化学习中的 GAIL,探索问题中的 RND 等等。
友好的用户接口,我们抽象了强化学习任务中的大部分常见对象,例如环境,策略,并将复杂的强化学习流程封装成丰富的中间件,让您随心所欲的构建自己的学习流程。
弹性的拓展能力,利用框架内集成的消息组件和事件编程接口,您可以灵活的将基础研究工作拓展到工业级大规模训练集群中,例如星际争霸智能体 DI-star。
核心概念¶
假如您尚未了解强化学习,可以转至我们的 强化学习教程 一窥强化学习的奇妙世界。
假如您已经接触过强化学习,想必已经非常了解强化学习的基本交互对象: 环境 和 智能体(或者构成智能体的策略)。
DI-engine 没有创造更多的概念,而是将这两者之间复杂的交互逻辑抽象成了声明式的中间件,例如 采集数据(collect),训练模型(train),评估模型(evaluate),保存模型(save_ckpt), 您可以依据最自然的方式调整流程中的各个环节。
使用 DI-engine 将会非常简单,在 快速开始 部分,我们将通过一个简单的例子向您介绍,如何使用 DI-engine 快速搭建一个经典的强化学习流程。