教程
API 文档
English Documentation
LightZero 是一个轻量、高效且易于理解的开源算法工具包,结合了蒙特卡洛树搜索(MCTS)和深度强化学习(RL)。 你可以在 GitHub 上找到源代码。
相关研究论文包括:
LightZero
UniZero
ReZero
main_config
create_config
AlphaZeroAgent
MuZeroAgent
EfficientZeroAgent
GumbelMuZeroAgent
SampledEfficientZeroAgent
SampledAlphaZeroAgent
train_alphazero
eval_alphazero
train_muzero
eval_muzero
train_muzero_with_gym_env
eval_muzero_with_gym_env
train_muzero_with_reward_model
LightZeroEnvWrapper
ActionDiscretizationEnvWrapper