RAG для тех, кто разочаровался: почему retrieval ломается и как это починитьВы собрали RAG-пайплайн: загрузили документы, нарезали на чанки, сгенерировали эмбеддинги, подключили векторную базу. Задаёте вопрос — модель отвечает уверенно и подробно. Показываете заказчику, тот в восторге. Потом начинается тестирование на реальных вопросах, и оказывается, что на половину из них система отвечает мимо: то находит не тот документ, то находит правильный, но не тот кусок, то вообще ничего релевантного не достаёт и модель уверенно галлюцинирует. Каждый раз проблема не в модели (GPT-4 и Claude отвечают хорошо, если им дать правильный контекст), а в retrieval — в том, как мы ищем релевантные куски документов. Модель отвечает ровно настолько хорошо, насколько хорош контекст, который ей подсунули. Рассмотрим три основные причины. Разобрать RAGhttps://habr.com/ru/companies/otus/articles/1034386/#ml #python #retrieval #rag #LLM #векторный_поиск
Related
🧠 L’AI chiede più banda e meno consumi: JEDEC prepara LPDDR6, la memoria mobile pensata per accelerare il futuro on-devi...
🧠 L’AI chiede più banda e meno consumi: JEDEC prepara LPDDR6, la memoria mobile pensata per accelerare il futuro on-device. #AI #LPDDR6🔗 https://www.tomshw.it/hardware/lai-ha-fame-...
When a free open-source model becomes the on-device ASR benchmark, you have to earn your price tag. Here's what happened...
When a free open-source model becomes the on-device ASR benchmark, you have to earn your price tag. Here's what happened when we tested Speechmatics vs Whisper. https://hackernoon....
• Google responsable des résumés faux générées par son ia ...• un concessionnaire responsable des propositions commercia...
• Google responsable des résumés faux générées par son ia ...• un concessionnaire responsable des propositions commerciales foireuses générées par son ia ... Les managers à deux ce...