chansung
/

Qwen2.5-1.5B-CRL-Open-R1-Code-GRPO-exp1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-CRL-Open-R1-Code-GRPO-exp1

Commit History

Model save

4be6085
verified

chansung commited on Mar 31

End of training

9a1590a
verified

chansung commited on Mar 31

Model save

15a8776
verified

chansung commited on Mar 31

initial commit

53aebc5
verified

chansung commited on Mar 31