Тестируем NVIDIA HGX B300 — инференс-сервер с 8 GPU и 2,3 ТБ VRAM на DeepSeek, Qwen и MiniMaxИтак, вы внедрили ИИ в свой сервис и решили ехать в продакшен, где у вас много пользователей. Закономерно возникает вопрос — а на чем запустить инференс, чтобы и пользователи были довольны скоростью работы, и бизнес не разорился. Привет! На связи Никита, системный архитектор Читать далее →https://habr.com/ru/companies/selectel/articles/1035066/#selectel #инференс #llm #gpu #nvidia #dgx #hgx_b300
Related
I finished arc-agent, a Go CLI for AI-generated system design workspaces.Instead of one giant chat answer, it stages req...
I finished arc-agent, a Go CLI for AI-generated system design workspaces.Instead of one giant chat answer, it stages requirements, entities, API, high-level design, and diagrams in...
care is recognition. you can’t really see it in someone else if you’ve trained yourself out of it.(on caring embarrassin...
care is recognition. you can’t really see it in someone else if you’ve trained yourself out of it.(on caring embarrassingly hard, and why irony costs more than it saves)#philosophy...
♬ River: https://suno.com/song/263f064d-07e4-433d-a0b8-1a0ade5abb25 🆙 #game #changer SUNO P #AI #related and #new #style...
♬ River: https://suno.com/song/263f064d-07e4-433d-a0b8-1a0ade5abb25 🆙 #game #changer SUNO P #AI #related and #new #style of #UTAU #vocaloid #ボーカロイド #music #音楽 #udio #kaiber #produc...