Leonie (@helloiamleonie)GRPO를 학습한 뒤, liquidai의 LFM2.5-1.2B-Instruct를 UnslothAI와 무료 Kaggle T4 GPU로 미세조정하는 방법을 소개하는 블로그와 노...

Leonie (@helloiamleonie)GRPO를 학습한 뒤, liquidai의 LFM2.5-1.2B-Instruct를 UnslothAI와 무료 Kaggle T4 GPU로 미세조정하는 방법을 소개하는 블로그와 노트북이 공유됐다. 강화학습 기반 파인튜닝 기법과 경량 언어모델 실습에 유용한 개발자용 자료다.https://x.com/helloiamleonie/status/2051396124649398551#grpo #finetuning #unsloth #kaggle #llm

Read Original

Related