Назад к дайджесту
Новость

Ретривал в 2026: как RAG перешёл с энкодеров на LLM (и что делать в своём проекте)

Статья описывает эволюцию RAG-архитектуры: отказ от классических энкодеров (BERT, BM25) в пользу дообученных LLM для эмбеддинга и реранкинга. Автор разбирает новый стек с инференсом на SGLang и даёт рекомендации по адаптации под узкие предметные области. Материал актуален для инженеров, внедряющих генеративный ИИ в продакшен.