Mastodon discussion May 26

Brian (@rantlab)Codex 프로젝트에 Grok을 사용해본 경험을 공유하며, CLI는 괜찮지만 Grok 성능은 아직 GPT-5.5 수준에는 못 미친다고 평가했습니다. 대신 Grok 5를 기대한다고 언급해,...

Brian (@rantlab)Codex 프로젝트에 Grok을 사용해본 경험을 공유하며, CLI는 괜찮지만 Grok 성능은 아직 GPT-5.5 수준에는 못 미친다고 평가했습니다. 대신 Grok 5를 기대한다고 언급해, LLM 코딩 보조 도구 및 모델 성능 비교 관점에서 참고할 만한 의견입니다.https://x.com/ran...

Mastodon discussion May 26

AI News | TestingCatalog (@testingcatalog)Grok의 내비게이션 바에 'Grok Build' 섹션이 새로 보이기 시작했지만 아직 동작하지 않는 상태입니다. 곧 웹 기반 Grok Bui...

AI News | TestingCatalog (@testingcatalog)Grok의 내비게이션 바에 'Grok Build' 섹션이 새로 보이기 시작했지만 아직 동작하지 않는 상태입니다. 곧 웹 기반 Grok Build 경험이 공개될 가능성을 시사하는 징후로 해석됩니다.https://x.com/testingcatalog/...

Mastodon discussion May 26

Globalize a Intifada (@TooPolemic)업무를 단계별로 분리해 서로 다른 모델을 배치하는 실전형 멀티모델 워크플로를 제안합니다. 검색은 Grok 4.3, 계획·추론은 Kimi 2.6, 코딩·테스...

Globalize a Intifada (@TooPolemic)업무를 단계별로 분리해 서로 다른 모델을 배치하는 실전형 멀티모델 워크플로를 제안합니다. 검색은 Grok 4.3, 계획·추론은 Kimi 2.6, 코딩·테스트·디버깅은 Qwen Coder와 GLM을 사용해 동일한 결과를 약 10배 저렴하게 달성했다고 주장합니다.h...

Mastodon discussion May 26

Globalize a Intifada (@TooPolemic)에이전트/워크플로를 작업별로 분리해 각 단계에 서로 다른 모델을 쓰는 구성 제안. 실시간 리서치·검색은 Grok 4.3, 계획/추론은 Kimi 2.6, 코...

Globalize a Intifada (@TooPolemic)에이전트/워크플로를 작업별로 분리해 각 단계에 서로 다른 모델을 쓰는 구성 제안. 실시간 리서치·검색은 Grok 4.3, 계획/추론은 Kimi 2.6, 코딩·테스트 작성·실행은 Qwen Coder, 디버깅은 GLM을 사용하면 동일한 결과를 10배 저렴하게 얻을 ...

Mastodon discussion May 23

Nyk (@nyk_builderz)Grok의 메모리 요약을 편집 가능하게 만들면, 메모리가 블랙박스가 아니라 제어 가능한 컨텍스트 계층이 된다는 인사이트입니다. 또한 ‘whoami?’ 같은 질문이 정체성 드리프트와 ...

Nyk (@nyk_builderz)Grok의 메모리 요약을 편집 가능하게 만들면, 메모리가 블랙박스가 아니라 제어 가능한 컨텍스트 계층이 된다는 인사이트입니다. 또한 ‘whoami?’ 같은 질문이 정체성 드리프트와 메모리 드리프트를 검증하는 적절한 테스트라는 점을 짚습니다. 에이전트 메모리 설계에 실무적으로 의미 있는 관...