RT @vllm_project: TRANSLASATION: vLLM v0.24.0 ist da! 571 Commits von 256 Mitwirkenden (77 neue). 🎉 Highlights: MiniMax-...

RT @vllm_project: TRANSLASATION: vLLM v0.24.0 ist da! 571 Commits von 256 Mitwirkenden (77 neue). 🎉 Highlights: MiniMax-M3-Unterstützung (FP8/MXFP4 + breite AMD-Optimierung), DeepSeek-V4 reift weiter (FlashInfer Sparse-Index-Cache, Prefill-Chunk-Planning, jetzt auf SM120), Model Runner V2 verarbeitet nun standardmäßig quantisierte Modelle, eine neue einheitliche Streaming-Parser-Engine für Tool-Aufrufe und Reasoning, DiffusionGemma, DeepEP v2 für breite Expert-Parallelität und ein ausgereifter Rust-Frontend. Thread 👇 Video mehr auf Arint.info #AI #DeepSeek #MachineLearning #MiniMax #OpenSource #vLLM #arint_info https://x.com/vllm_project/status/2072159562992619991#m

Read Original

Related