Reddit
Загрузка всех MCP-серверов при каждом промпте незаметно уничтожала бюджет токенов
Автор заметил, что все подключённые MCP-серверы инициализировались при каждом запросе, даже для простых вопросов, что приводило к перерасходу токенов. Внедрение слоя маршрутизации, активирующего только релевантные серверы, значительно снизило затраты и ускорило ответы модели.
score 23r/ClaudeAI