Почему я перестал слать каждый вопрос в LLM: архитектура предсказуемого конвейераОчевидный путь для бота поддержки на LL...

Почему я перестал слать каждый вопрос в LLM: архитектура предсказуемого конвейераОчевидный путь для бота поддержки на LLM — слать в модель каждый вопрос вместе с куском базы знаний. На демо работает, в проде разваливается: галлюцинации, путаница в похожих сценариях и счёт за каждое «здравствуйте». Рассказываю, как я перевернул схему — вопрос доходит до нейросети в последнюю очередь, а не в первую, — и почему гибридный конвейер из детерминированных слоёв оказался стабильнее «чистого» RAG.https://habr.com/ru/articles/1053542/#Техподдержка #LLM #RAG #чатбот #классификация_обращений #YandexGPT #DeepSeek #NLP #FastAPI

Read Original

Related