Назад к дайджесту
Новость

YAKE вместо нейросети: как мы заменили 600 МБ ONNX-реранкера на 400 строк кода

Статья описывает замену тяжёлого нейросетевого реранкера (ONNX) на алгоритм YAKE в RAG-системе для десктопного приложения. Авторы демонстрируют, как отказ от модели позволил снизить потребление памяти и CPU до микросекундной латентности. Материал подчёркивает важность выбора правильного инструмента: не каждый AI-компонент должен быть нейросетью.