qingyangzhang
/

Qwen2.5-3B-Open-R1-GRPO-Self-TQA

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Open-R1-GRPO-Self-TQA / README.md

Commit History

End of training

077a600
verified

qingyangzhang commited on Mar 5

Model save

69d74e2
verified

qingyangzhang commited on Mar 5

End of training

eebbfb3
verified

qingyangzhang commited on Mar 5

Model save

3d56725
verified

qingyangzhang commited on Mar 5

End of training

de6cf24
verified

qingyangzhang commited on Mar 5

Model save

b8efdea
verified

qingyangzhang commited on Mar 5

End of training

c193840
verified

qingyangzhang commited on Mar 4

Model save

1ec6043
verified

qingyangzhang commited on Mar 4

End of training

162d6a9
verified

qingyangzhang commited on Mar 4

Model save

4b592b0
verified

qingyangzhang commited on Mar 4