chloeli
/

qwen-2.5-0.5B-instruct-sft-lora-countdown-optimal-1k

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Model card Files Files and versions Community

qwen-2.5-0.5B-instruct-sft-lora-countdown-optimal-1k

Commit History

End of training

2636455
verified

chloeli commited on Mar 29

Model save

b14c6d4
verified

chloeli commited on Mar 29

Training in progress, step 125

0293557
verified

chloeli commited on Mar 29

Training in progress, step 100

39dc6b0
verified

chloeli commited on Mar 29

initial commit

0001cee
verified

chloeli commited on Mar 29