Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)Если вы строили RAG в 2023, ваш стек выглядел плюс-минус одинаково. BERT-семейство (BGE, e5) для семантики, BM25 для буквальных совпадений, cross-encoder для реранкинга, какой-нибудь Qdrant сверху. Этим жили два года, и многие до сих пор так живут. Но если посмотреть, кто реально гоняется в продакшене у команд, которые ушли вперёд, ландшафт другой. Энкодеров там почти нет. Эмбеддит файнтюненная LLM. Реранкер — тоже LLM. Инференс на SGLang, а не на ONNX. И вся обвязка перестроилась под это. Эта статья про то, что поменялось и как переиспользовать этот стек у себя. Особенно если вы работаете в узком домене, где готовых датасетов нет.https://habr.com/ru/articles/1049872/#RAG #эмбеддинги #embeddings #retrieval #LLM #Qwen3 #Qdrant #vector_search #hard_negatives #LLM2Vec
Related
Shower thought: The people asking the loudest for Agentic AI replacing their core tasks should just look for a new job w...
Shower thought: The people asking the loudest for Agentic AI replacing their core tasks should just look for a new job where the tasks are actually fun.If you don’t like software e...
Hoe creatief is AI? AI is niet creatief, het heeft zicht gevoed met de creativiteit van de mens, uitstijgen boven dit ni...
Hoe creatief is AI? AI is niet creatief, het heeft zicht gevoed met de creativiteit van de mens, uitstijgen boven dit niveau kan het niet. AI is geen levend creatief denkend scheps...
Google Assistant ruined my smart home setup — but Gemini just saved itGemini made my old displays and cameras so much be...
Google Assistant ruined my smart home setup — but Gemini just saved itGemini made my old displays and cameras so much better.https://www.androidauthority.com/google-assistant-ruine...