davidoj01
/

unsloth-phi-4-Instruct-LORA-Open-R1-Code-GRPO-b2-as8-t12-lr1en5

Model card Files Files and versions Community

unsloth-phi-4-Instruct-LORA-Open-R1-Code-GRPO-b2-as8-t12-lr1en5

Commit History

Training in progress, step 350

aee9fd0
verified

davidoj01 commited on 17 days ago

Training in progress, step 300

41b2d88
verified

davidoj01 commited on 17 days ago

Training in progress, step 250

109b534
verified

davidoj01 commited on 17 days ago

Training in progress, step 200

26fbfbe
verified

davidoj01 commited on 18 days ago

Training in progress, step 150

a5d43e3
verified

davidoj01 commited on 18 days ago

Training in progress, step 100

736eafe
verified

davidoj01 commited on 18 days ago

Training in progress, step 50

9551f89
verified

davidoj01 commited on 18 days ago

initial commit

063f1f8
verified

davidoj01 commited on 18 days ago