RAG для тех, кто разочаровался: почему retrieval ломается и как это починитьВы собрали RAG-пайплайн: загрузили документы...

RAG для тех, кто разочаровался: почему retrieval ломается и как это починитьВы собрали RAG-пайплайн: загрузили документы, нарезали на чанки, сгенерировали эмбеддинги, подключили векторную базу. Задаёте вопрос — модель отвечает уверенно и подробно. Показываете заказчику, тот в восторге. Потом начинается тестирование на реальных вопросах, и оказывается, что на половину из них система отвечает мимо: то находит не тот документ, то находит правильный, но не тот кусок, то вообще ничего релевантного не достаёт и модель уверенно галлюцинирует. Каждый раз проблема не в модели (GPT-4 и Claude отвечают хорошо, если им дать правильный контекст), а в retrieval — в том, как мы ищем релевантные куски документов. Модель отвечает ровно настолько хорошо, насколько хорош контекст, который ей подсунули. Рассмотрим три основные причины. Разобрать RAGhttps://habr.com/ru/companies/otus/articles/1034386/#ml #python #retrieval #rag #LLM #векторный_поиск

RAG для тех, кто разочаровался: почему retrieval ломается и как это починитьВы собрали RAG-пайплайн: загрузили документы...

Metadata

Related

🧠 L’AI chiede più banda e meno consumi: JEDEC prepara LPDDR6, la memoria mobile pensata per accelerare il futuro on-devi...

When a free open-source model becomes the on-device ASR benchmark, you have to earn your price tag. Here's what happened...

• Google responsable des résumés faux générées par son ia ...• un concessionnaire responsable des propositions commercia...