llm_finetuning - a tuyenTS Collection

tuyenTS 's Collections

multi-modalities

llms

voice

llm_compression

llm_explanation

llm_finetuning

updated Feb 5

Instruction-tuned Language Models are Better Knowledge Learners

Paper • 2402.12847 • Published Feb 20, 2024 • 27
LoRA Land: 310 Fine-tuned LLMs that Rival GPT-4, A Technical Report

Paper • 2405.00732 • Published Apr 29, 2024 • 122
REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

Paper • 2501.03262 • Published Jan 4 • 99
Process Reinforcement through Implicit Rewards

Paper • 2502.01456 • Published Feb 3 • 62