Reddit
Маршрутизация работы агента через 4 уровня LLM: оркестратор, советник, глубокое рассуждение, премиум
Автор описывает архитектуру из четырёх уровней для обработки запросов агентов, где дешёвые модели выполняют маршрутизацию, а мощные подключаются только для сложных задач. Такой подход оптимизирует стоимость и скорость, делая интерактивные циклы более отзывчивыми по сравнению с использованием одной дорогой модели. В примере используются DeepSeek V4 Flash, GLM-5.2 и Opus 4.8 с чётким разделением ролей по сложности.
score 40r/AI_Agents