stevibe (@stevibe)새로 나온 Qwen3.6 35B-A3B를 여러 GPU(RTX 3090/4090/5090, DGX Spark)에서 돌려 성능을 비교한 벤치마크다. Ollama를 백엔드로 사용했으며, 지...

stevibe (@stevibe)새로 나온 Qwen3.6 35B-A3B를 여러 GPU(RTX 3090/4090/5090, DGX Spark)에서 돌려 성능을 비교한 벤치마크다. Ollama를 백엔드로 사용했으며, 지연시간(TTFT)과 토큰 처리 속도를 공개해 실사용 관점의 성능을 보여준다.https://x.com/stevibe/status/2045087373516492954#qwen #ollama #benchmark #llm #gpus

Read Original

Related