Reddit11 мая 2026 г.

Мы перестали вручную оптимизировать LLM-стек — теперь он настраивается сам

Автор описывает создание самооптимизирующегося стека LLM, где роутер на основе эмбеддингов выбирает лучшую модель для каждого запроса по реальным данным. Система использует обратную связь для дообучения 7B-модели, достигая 95% качества заявленного GPT-5.1 при 2% стоимости. Автоматическая детекция галлюцинаций и накопление трасс позволяют снижать расходы на 80% за четыре месяца без ручного вмешательства.

score 16r/artificial

reddit.comhttps://www.reddit.com/r/artificial/comments/1t9on1e/we_stopped_optimizing_our_llm_stack_manually_it/