Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)Если вы строили RAG в 2023, в...

Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)Если вы строили RAG в 2023, ваш стек выглядел плюс-минус одинаково. BERT-семейство (BGE, e5) для семантики, BM25 для буквальных совпадений, cross-encoder для реранкинга, какой-нибудь Qdrant сверху. Этим жили два года, и многие до сих пор так живут. Но если посмотреть, кто реально гоняется в продакшене у команд, которые ушли вперёд, ландшафт другой. Энкодеров там почти нет. Эмбеддит файнтюненная LLM. Реранкер — тоже LLM. Инференс на SGLang, а не на ONNX. И вся обвязка перестроилась под это. Эта статья про то, что поменялось и как переиспользовать этот стек у себя. Особенно если вы работаете в узком домене, где готовых датасетов нет.https://habr.com/ru/articles/1049872/#RAG #эмбеддинги #embeddings #retrieval #LLM #Qwen3 #Qdrant #vector_search #hard_negatives #LLM2Vec

Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)Если вы строили RAG в 2023, в...

Metadata

Related

Shower thought: The people asking the loudest for Agentic AI replacing their core tasks should just look for a new job w...

Hoe creatief is AI? AI is niet creatief, het heeft zicht gevoed met de creativiteit van de mens, uitstijgen boven dit ni...

Google Assistant ruined my smart home setup — but Gemini just saved itGemini made my old displays and cameras so much be...