morizon
/

llm-jp-3-13b-instruct2-grpo-R1-0223_lora_step1600

text-generation-inference

Model card Files Files and versions Community

llm-jp-3-13b-instruct2-grpo-R1-0223_lora_step1600

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

morizon's picture

Trained with Unsloth

17a3593 verified 4 months ago