chansung
/

Qwen2.5-1.5B-CRL-Open-R1-Code-GRPO-exp1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-CRL-Open-R1-Code-GRPO-exp1

Commit History

End of training

ee5b2b4
verified

chansung commited on 28 days ago

Model save

4be6085
verified

chansung commited on 28 days ago

End of training

9a1590a
verified

chansung commited on 28 days ago

Model save

15a8776
verified

chansung commited on 28 days ago

initial commit

53aebc5
verified

chansung commited on 28 days ago