Mastodon discussion May 5

Wes Roth (@WesRoth)Mistral의 새로 공개된 Medium 3.5 모델이 오픈 웨이트 Vals Index에서 10위를 기록했다. 이전 모델인 Mistral Large 3 대비 전체 Vals Index...

Wes Roth (@WesRoth)Mistral의 새로 공개된 Medium 3.5 모델이 오픈 웨이트 Vals Index에서 10위를 기록했다. 이전 모델인 Mistral Large 3 대비 전체 Vals Index에서 18% 개선됐고, Finance Agent 항목에서는 28% 상승해 오픈 웨이트 모델 성능 향상을 보여...

Mastodon discussion May 3

金のニワトリ (@gosrum)Mac Studio(M2 Ultra)에서 llama-bench로 Mistral-Medium-3.5-128B의 추론 속도를 측정한 결과를 공유했다. prefill은 약 57.5 tps, d...

金のニワトリ (@gosrum)Mac Studio(M2 Ultra)에서 llama-bench로 Mistral-Medium-3.5-128B의 추론 속도를 측정한 결과를 공유했다. prefill은 약 57.5 tps, decode는 약 6.5 tps였고, 128k 컨텍스트는 가능했지만 200k에서는 OOM이 발생했다고 밝혔다....

Mastodon discussion May 1

AISatoshi (@AiXsatoshi)Mistral3 시리즈와 Qwen3.6-27B의 아키텍처 특징을 비교했다. Mistral3는 모든 토큰을 모든 레이어에서 보는 고해상도 방식이고, Qwen3.6-27B는 여러...

AISatoshi (@AiXsatoshi)Mistral3 시리즈와 Qwen3.6-27B의 아키텍처 특징을 비교했다. Mistral3는 모든 토큰을 모든 레이어에서 보는 고해상도 방식이고, Qwen3.6-27B는 여러 레이어에서 linear attention으로 스트리밍하다가 4레이어마다 full attention으로 재동...

Mastodon discussion Apr 30

Claude Sonnet 4.5超えのフランス製AIモデル「Mistral Medium 3.5」がオープンモデルとして公開される&Mistral Vibeがクラウド対応 https://www.yayafa.com/2790245/ #...

Claude Sonnet 4.5超えのフランス製AIモデル「Mistral Medium 3.5」がオープンモデルとして公開される&Mistral Vibeがクラウド対応 https://www.yayafa.com/2790245/ #AgenticAi #AI #Anthropic #AnthropicClaude #ArtificialGeneral...

Mastodon discussion Apr 30

金のニワトリ (@gosrum)Mistral-Medium-3.5-128B의 GGUF 지원이 아직 진행 중이라고 언급했으며, Mac Studio에서 Q4_K_XL을 로드할 때 메모리 부족으로 재시작이 발생했다고 보고했습...

金のニワトリ (@gosrum)Mistral-Medium-3.5-128B의 GGUF 지원이 아직 진행 중이라고 언급했으며, Mac Studio에서 Q4_K_XL을 로드할 때 메모리 부족으로 재시작이 발생했다고 보고했습니다. 모델 배포 호환성과 로컬 실행 한계를 보여주는 내용입니다.https://x.com/gosrum/sta...