qingyangzhang
/

Qwen2.5-3B-Open-R1-GRPO-Self-TQA

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Open-R1-GRPO-Self-TQA / training_args.bin

Commit History

Training in progress, step 10

061ae9e
verified

qingyangzhang commited on Mar 5

Training in progress, step 10

16212fd
verified

qingyangzhang commited on Mar 5

Training in progress, step 30

c025d31
verified

qingyangzhang commited on Mar 4

Training in progress, step 25

5e28e06
verified

qingyangzhang commited on Mar 4

Training in progress, step 10

ead98a8
verified

qingyangzhang commited on Mar 4

Training in progress, step 10

da2c658
verified

qingyangzhang commited on Mar 4