LightZero

教程

  • 安装和快速入门指南
  • LightZero 中如何自定义算法?
  • LightZero 中如何自定义环境?
  • LightZero 中如何设置配置文件?
  • LightZero的日志监控体系

API 文档

  • Agent
  • Config
  • Entry
  • Envs
  • MCTS
  • Model
  • Policy
  • Worker
LightZero
  • LightZero文档
  • View page source

LightZero文档

概述

English Documentation

LightZero 是一个轻量、高效且易于理解的开源算法工具包,结合了蒙特卡洛树搜索(MCTS)和深度强化学习(RL)。 你可以在 GitHub 上找到源代码。

相关研究论文包括:

  • LightZero

  • UniZero

  • ReZero

教程

  • 安装和快速入门指南
    • 安装
    • 使用 Docker 安装
    • 快速入门
  • LightZero 中如何自定义算法?
    • 基本步骤
    • 注意事项
  • LightZero 中如何自定义环境?
    • 与 BaseEnv 的主要差异
    • 基本步骤
    • 棋类环境的特殊方法
    • LightZeroEnvWrapper
    • 注意事项
  • LightZero 中如何设置配置文件?
    • 1. main_config
    • 2. create_config
    • 3. 运行算法
    • 4. 注意事项
  • LightZero的日志监控体系
    • 1. 文件目录结构
    • 2. 日志文件解析
    • 3. 检查点文件
    • 4. 总结

API 文档

  • Agent
  • Config
    • lzero.config.meta
  • Entry
    • train_alphazero
    • eval_alphazero
    • train_muzero
    • eval_muzero
    • train_muzero_with_gym_env
    • eval_muzero_with_gym_env
    • train_muzero_with_reward_model
  • Envs
    • LightZeroEnvWrapper
    • ActionDiscretizationEnvWrapper
  • MCTS
    • Buffer
    • Tree Search
  • Model
    • Common
    • MuZeroModel
    • MuZeroModelMLP
    • EfficientZeroModel
    • EfficientZeroModelMLP
    • AlphaZeroModel
    • SampledEfficientZeroModel
    • SampledEfficientZeroModelMLP
    • StochasticMuZeroModel
    • StochasticMuZeroModelMLP
  • Policy
    • AlphaZeroPolicy
    • MuZeroPolicy
    • EfficientZeroPolicy
    • Gumbel AlphaZeroPolicy
    • Gumbel MuZeroPolicy
    • Sampled AlphaZeroPolicy
    • Sampled MuZeroPolicy
    • Sampled EfficientZeroPolicy
    • Stochastic MuZeroPolicy
    • UniZeroPolicy
  • Worker
    • MuZeroCollector
    • MuZeroEvaluator
Next

© Copyright 2023, OpenDILab Contributors.

Built with Sphinx using a theme provided by Read the Docs.