AdversarialRLHF
/

rloo_pythia410m_tldr6.9b_rm410mdata

Model card Files Files and versions Community

rloo_pythia410m_tldr6.9b_rm410mdata / checkpoint-164

Commit History

Training in progress, step 164, checkpoint

71b30ba
verified

Muqeeth commited on Apr 29