Mastodon discussion Discussions Apr 10 4 views

Triton比6倍超の性能を30行で：MetaのHelionがAIカーネルの標準へカーネル最適化は長年、GPUプログラミングの深い知識を持つ一握りの専門家が支配してきた領域だ。NVIDIAのCUDAでAttentionカーネルを書けば数千...

by Y Kobayashi

Triton比6倍超の性能を30行で：MetaのHelionがAIカーネルの標準へカーネル最適化は長年、GPUプログラミングの深い知識を持つ一握りの専門家が支配してきた領域だ。NVIDIAのCUDAでAttentionカーネルを書けば数千行に及び、2019年にOpenAIが発表したTritonで約120行まで圧縮されても、手動チューニングの壁はほとんど変わらなかった。Metaが開発したPython […] https://xenospectrum.com/helion-pytorch-foundation-kernel-dsl-autotuning/

Read Original

AI Hardware NVIDIA OpenAI

Metadata

Reblogs Count: 2
Account: masapoco@xenospectrum.com

Mastodon discussion 35m ago

金のニワトリ (@gosrum)Qwen3.7이 공개됐다는 언급입니다. 구체적 성능이나 변경점은 없지만, Qwen 계열 최신 모델 소식으로 로컬/오픈 가중치 LLM 흐름을 추적하는 개발자에게는 참고할 만한 업데이트입니다...

金のニワトリ (@gosrum)Qwen3.7이 공개됐다는 언급입니다. 구체적 성능이나 변경점은 없지만, Qwen 계열 최신 모델 소식으로 로컬/오픈 가중치 LLM 흐름을 추적하는 개발자에게는 참고할 만한 업데이트입니다.https://x.com/gosrum/status/2056507655422923086#qwen #llm #...

Mastodon discussion 35m ago

Joan Rodriguez (@joanrod_ai)@QuiverAI의 Arrow 1.1이 패션 스케치를 깔끔하고 편집 가능한 SVG로 변환하는 모습을 보여준다. 원본 선과 형태를 유지하는 디자인 생성 기능으로, 단순...

Joan Rodriguez (@joanrod_ai)@QuiverAI의 Arrow 1.1이 패션 스케치를 깔끔하고 편집 가능한 SVG로 변환하는 모습을 보여준다. 원본 선과 형태를 유지하는 디자인 생성 기능으로, 단순 이미지 생성이 아니라 실무용 벡터 디자인 생성에 가깝다.https://x.com/joanrod_ai/sta...

Mastodon discussion 35m ago

Bindu Reddy (@bindureddy)코딩 경험 없이도 Opus 4.7, GPT 5.5 xHigh, Gemini 3.1 Pro, Grok 4.3를 활용해 모바일 앱을 엔드투엔드로 만들 수 있다고 주장한다. D...

Bindu Reddy (@bindureddy)코딩 경험 없이도 Opus 4.7, GPT 5.5 xHigh, Gemini 3.1 Pro, Grok 4.3를 활용해 모바일 앱을 엔드투엔드로 만들 수 있다고 주장한다. DB, 인증, 백엔드 설정 없이 한 번의 프롬프트로 Android/iOS 배포까지 가능하다고 소개해 LLM 기...

Triton比6倍超の性能を30行で：MetaのHelionがAIカーネルの標準へ カーネル最適化は長年、GPUプログラミングの深い知識を持つ一握りの専門家が支配してきた領域だ。NVIDIAのCUDAでAttentionカーネルを書けば数千...

Metadata

Related

金のニワトリ (@gosrum)Qwen3.7이 공개됐다는 언급입니다. 구체적 성능이나 변경점은 없지만, Qwen 계열 최신 모델 소식으로 로컬/오픈 가중치 LLM 흐름을 추적하는 개발자에게는 참고할 만한 업데이트입니다...

Joan Rodriguez (@joanrod_ai)@QuiverAI의 Arrow 1.1이 패션 스케치를 깔끔하고 편집 가능한 SVG로 변환하는 모습을 보여준다. 원본 선과 형태를 유지하는 디자인 생성 기능으로, 단순...

Bindu Reddy (@bindureddy)코딩 경험 없이도 Opus 4.7, GPT 5.5 xHigh, Gemini 3.1 Pro, Grok 4.3를 활용해 모바일 앱을 엔드투엔드로 만들 수 있다고 주장한다. D...

Triton比6倍超の性能を30行で：MetaのHelionがAIカーネルの標準へカーネル最適化は長年、GPUプログラミングの深い知識を持つ一握りの専門家が支配してきた領域だ。NVIDIAのCUDAでAttentionカーネルを書けば数千...