Mastodon discussion May 10

Avi Chawla (@_avichawla)프롬프트 엔지니어링, RAG, 컨텍스트 엔지니어링, 파인튜닝, 에이전트, LLM 배포/최적화, 안전성·평가·관측성까지 포함한 풀스택 AI 엔지니어링 로드맵을 소개합니다. 무...

Avi Chawla (@_avichawla)프롬프트 엔지니어링, RAG, 컨텍스트 엔지니어링, 파인튜닝, 에이전트, LLM 배포/최적화, 안전성·평가·관측성까지 포함한 풀스택 AI 엔지니어링 로드맵을 소개합니다. 무료 오픈소스 자료도 함께 제공되어 AI 개발자에게 유용합니다.https://x.com/_avichawla/s...

Mastodon discussion May 9

Show HN: Nexa-gauge – Cache/cost-aware graph-based eval for LLM and RAGNexa-gauge는 LLM, RAG, 에이전트 시스템의 생성 결과를 평가하기 위한 파이...

Show HN: Nexa-gauge – Cache/cost-aware graph-based eval for LLM and RAGNexa-gauge는 LLM, RAG, 에이전트 시스템의 생성 결과를 평가하기 위한 파이썬 패키지이자 CLI 도구로, 그래프 기반 평가 파이프라인을 통해 반복 가능한 품질 지표와 비용 추정, 캐시...

Dev.to tutorial May 9

You're doing RAG wrong

There's a new approach that: cuts corpus size by 40x. reduces tokens per query by 3x. improves vector...