Akshay (@akshay_pachaar)대규모 언어모델을 커스터마이즈할 때 알아두면 좋은 파인튜닝 기법 목록이 정리됐다. LoRA, QLoRA, Prefix Tuning, Adapter Tuning, Instru...

Akshay (@akshay_pachaar)대규모 언어모델을 커스터마이즈할 때 알아두면 좋은 파인튜닝 기법 목록이 정리됐다. LoRA, QLoRA, Prefix Tuning, Adapter Tuning, Instruction Tuning, P-Tuning, BitFit, Soft Prompts, RLHF, RLAIF, DPO, GRPO 등이 포함된다.https://x.com/akshay_pachaar/status/2045125478391099858#llm #finetuning #lorA #rlhf #dpo

Read Original

Related