DRAматургия GPU в Kubernetes: зачем нужен DRA, если Device Plugin работает? Разбираем грабли AI-инфраструктурыDevice plugin умеет выделять только целочисленные ресурсы: одну карту, две карты — или одну MIG‑партицию, но не «полкарты» и не «30% памяти». В реальности же нужны доли памяти, учёт топологии, предсказуемые обновления и изоляция, а не пулы лейблов и кастомные шедулеры. Разобрал, почему индустрия устала от костылей, как это проявляется в настоящем AI‑кластере и что именно пытается исправить DRA. Читать, если хотите управлять ресурсами явно, а не тушить пожары по расписанию. Понять, куда двигатьсяhttps://habr.com/ru/companies/flant/articles/1020276/#gpu #device_plugin #dra #nvidia #mig #volcano #volcano_scheduler #инференс #gpu_operator #llm
Related
Absolutely disgusting. If Square Enix couldn't bother to hire a proper human artist, what makes you think the final prod...
Absolutely disgusting. If Square Enix couldn't bother to hire a proper human artist, what makes you think the final product will be any better?#SquareEnix #KingdomHearts #Gaming #V...
I just saved $180 a year on my Google AI plan without losing my Drive storage - here's howGoogle AI Plus just got cheape...
I just saved $180 a year on my Google AI plan without losing my Drive storage - here's howGoogle AI Plus just got cheaper, and it's the easiest way to reduce my Google One bill wit...
aicommits vs opencommit: AI-Generated Git Commit Messages ComparedTwo open-source CLIs read your staged diff and write t...
aicommits vs opencommit: AI-Generated Git Commit Messages ComparedTwo open-source CLIs read your staged diff and write the commit message for you. We compare aicommits and opencomm...