AdversarialRLHF
/

rloo_pythia410m_tldr6.9b_rm410mdata

Model card Files Files and versions Community

rloo_pythia410m_tldr6.9b_rm410mdata / checkpoint-236 /optimizer.pt

Commit History

Training in progress, step 236, checkpoint

9029c9c
verified

Muqeeth commited on Apr 30