chansung
/

Qwen2.5-1.5B-CRL-Open-R1-Code-GRPO-exp1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-CRL-Open-R1-Code-GRPO-exp1 / training_args.bin

Commit History

Model save

4be6085
verified

chansung commited on Mar 31

Model save

15a8776
verified

chansung commited on Mar 31