Mastodon discussion Apr 13

タムズの乗組員には、ノードについてちゃんと話しておかないとmesh-llm:余っているPCのGPUを束ねて巨大LLMを動かす分散推論の新アプローチ - Qiita https://qiita.com/nogataka/items/d6776...

タムズの乗組員には、ノードについてちゃんと話しておかないとmesh-llm:余っているPCのGPUを束ねて巨大LLMを動かす分散推論の新アプローチ - Qiita https://qiita.com/nogataka/items/d6776506848d08815be9#Apple #LLM #news #bot

Mastodon discussion Apr 13

fly51fly (@fly51fly)MegaTrain은 100B+ 파라미터 대형 언어모델을 단일 GPU에서 풀 프리시전으로 학습할 수 있는 방법을 제시한다. 대규모 LLM 학습의 비용과 하드웨어 제약을 크게 낮출 수...

fly51fly (@fly51fly)MegaTrain은 100B+ 파라미터 대형 언어모델을 단일 GPU에서 풀 프리시전으로 학습할 수 있는 방법을 제시한다. 대규모 LLM 학습의 비용과 하드웨어 제약을 크게 낮출 수 있는 중요한 트레이닝 기술로 보인다.https://x.com/fly51fly/status/204344116...

Mastodon discussion Apr 12

NVIDIA NeMoとは?カスタム生成AI開発を加速するワークフローを徹底解説|GPUならNTTPC|NVIDIAエリートパートナー https://www.yayafa.com/2779971/ #AgenticAi #AI #Arti...

NVIDIA NeMoとは?カスタム生成AI開発を加速するワークフローを徹底解説|GPUならNTTPC|NVIDIAエリートパートナー https://www.yayafa.com/2779971/ #AgenticAi #AI #ArtificialGeneralIntelligence #ArtificialIntelligence #NVIDIA #エ...

Mastodon discussion Apr 11

Dan McAteer (@daniel_mac8)MegaTrain을 소개하며, 단일 GPU에서 100B+ 파라미터 LLM을 학습할 수 있다고 주장한다. 개인이 집에서 직접 학습한 슈퍼인텔리전스를 갖는 미래를 언급해, ...

Dan McAteer (@daniel_mac8)MegaTrain을 소개하며, 단일 GPU에서 100B+ 파라미터 LLM을 학습할 수 있다고 주장한다. 개인이 집에서 직접 학습한 슈퍼인텔리전스를 갖는 미래를 언급해, 대규모 모델 학습 효율을 크게 끌어올릴 수 있는 잠재적 기술로 주목된다.https://x.com/daniel...