Sudo su (@sudoingX)Gemma 4 31B dense q4_k_m를 RTX 5090 모바일 24GB가 탑재된 ROG Scar 18에서 구동한 성능 후기다. VRAM 거의 전체를 사용하면서 GPU가 99%...

Sudo su (@sudoingX)Gemma 4 31B dense q4_k_m를 RTX 5090 모바일 24GB가 탑재된 ROG Scar 18에서 구동한 성능 후기다. VRAM 거의 전체를 사용하면서 GPU가 99%로 고정됐고, 초당 15토큰을 지속적으로 처리해 모바일 GPU에서도 고성능 로컬 LLM 실행 가능성을 보여준다.https://x.com/sudoingX/status/2045437666968420540#gemma #llm #rtx5090 #localai #ondevice

Read Original

Related