Назад к дайджесту
Новость

Агент Hermes незаметно потратил 603 млн токенов — как я сократил фоновые расходы в 125 раз

Автор обнаружил, что фоновые задачи агента Hermes (сжатие контекста, поиск, vision) незаметно потребляли огромные объемы токенов через модель kimi-k2.6. Проблема возникла из-за автоматического переключения провайдеров без явных ключей fallback. Статья описывает диагностику логов и настройку конфигурации для оптимизации затрат на LLM.