Shortcuts

Python Module Index

l
 
l
lightrft
    lightrft.datasets.grm_dataset
    lightrft.datasets.hpdv3
    lightrft.datasets.image_reward_db
    lightrft.datasets.imagegen_cot_reward
    lightrft.datasets.omnirewardbench
    lightrft.datasets.rapidata
    lightrft.datasets.utils
    lightrft.models
    lightrft.models.actor_al
    lightrft.models.actor_language
    lightrft.models.actor_vl
    lightrft.models.grm_vl
    lightrft.models.loss
    lightrft.models.monkey_patch
    lightrft.models.monkey_patch.apply
    lightrft.models.monkey_patch.llama
    lightrft.models.monkey_patch.qwen
    lightrft.models.srm_al
    lightrft.models.srm_vl
    lightrft.models.utils
    lightrft.strategy
    lightrft.strategy.config
    lightrft.strategy.deepspeed
    lightrft.strategy.deepspeed.deepspeed
    lightrft.strategy.deepspeed.deepspeed_utils
    lightrft.strategy.fake_strategy
    lightrft.strategy.fsdp
    lightrft.strategy.fsdp.fsdp_optimizer
    lightrft.strategy.fsdp.fsdp_utils
    lightrft.strategy.fsdp.fsdpv2
    lightrft.strategy.sglang_utils
    lightrft.strategy.sglang_utils.sgl_model_saver
    lightrft.strategy.sglang_utils.sglang_engine
    lightrft.strategy.strategy
    lightrft.strategy.strategy_base
    lightrft.strategy.utils
    lightrft.strategy.utils.broadcast_utils
    lightrft.strategy.utils.ckpt_utils
    lightrft.strategy.utils.data_utils
    lightrft.strategy.utils.distributed_util
    lightrft.strategy.utils.optimizer_utils
    lightrft.strategy.utils.parallel_utils
    lightrft.strategy.utils.statistic
    lightrft.strategy.vllm_utils
    lightrft.strategy.vllm_utils.vllm_worker_wrap_no_ray
    lightrft.trainer
    lightrft.trainer.experience_maker
    lightrft.trainer.experience_maker_vl
    lightrft.trainer.fast_exp_maker
    lightrft.trainer.grm_trainer_vl
    lightrft.trainer.kl_controller
    lightrft.trainer.ppo_trainer
    lightrft.trainer.ppo_trainer_vl
    lightrft.trainer.replay_buffer
    lightrft.trainer.replay_buffer_utils
    lightrft.trainer.replay_buffer_vl
    lightrft.trainer.spmd_ppo_trainer
    lightrft.trainer.srm_trainer_al
    lightrft.trainer.srm_trainer_vl
    lightrft.trainer.utils
    lightrft.utils
    lightrft.utils.cli_args
    lightrft.utils.distributed_sampler
    lightrft.utils.logging_utils
    lightrft.utils.processor
    lightrft.utils.remote_rm_utils
    lightrft.utils.timer
    lightrft.utils.trajectory_saver
    lightrft.utils.utils