Назад к дайджесту
Reddit

Загрузка всех MCP-серверов при каждом промпте незаметно уничтожала бюджет токенов

Автор заметил, что все подключённые MCP-серверы инициализировались при каждом запросе, даже для простых вопросов, что приводило к перерасходу токенов. Внедрение слоя маршрутизации, активирующего только релевантные серверы, значительно снизило затраты и ускорило ответы модели.

score 23r/ClaudeAI