RAG в энтерпрайзе: почему демо работает, а прод нетПредставьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней документации, надо себе такой же. До конца квартала». Через четыре месяца у тебя есть Pinecone, OpenAI API, две недели работы над парсингом PDF и чат-бот, который на демо отвечает на пять подобранных вопросов идеально. А на шестой, который задаст любой нормальный сотрудник, отвечает уверенным бредом. Дальше про то, что именно между этими двумя состояниями происходит. Но без «правильной архитектуры RAG», потому что такой не существует.https://habr.com/ru/articles/1038670/#RAG #LLM #retrievalaugmented_generation #векторные_базы_данных #эмбеддинги #чанкинг #корпоративный_поиск #галлюцинации_LLM #OpenAI #Pinecone
Related
A #Solarpunk podcast happily talking about “Public AI”.I get the appeal of smaller, focused models, but can we drop “AI”...
A #Solarpunk podcast happily talking about “Public AI”.I get the appeal of smaller, focused models, but can we drop “AI”, as it is a wankeeteering term since 1956?#ai
« Ce n’est pas à eux de décider » : l’ #europe part en guerre contre #apple sur le blocage de #siri #aiPour la #ce, le p...
« Ce n’est pas à eux de décider » : l’ #europe part en guerre contre #apple sur le blocage de #siri #aiPour la #ce, le problème ne vient pas du #DMA, mais du refus d’Apple d’ouvrir...
iCloud+ Subscribers Get Higher Apple Intelligence Usage Limits in iOS 27Certain Apple Intelligence features in iOS 27 wi...
iCloud+ Subscribers Get Higher Apple Intelligence Usage Limits in iOS 27Certain Apple Intelligence features in iOS 27 will carry daily usage limits, with iCloud+ subscribers receiv...