Назад к дайджесту
Reddit

Как сэкономить 80% на счёте за Claude с помощью оптимизации контекста

Автор делится практическими приёмами снижения расходов при работе с Claude 4.6 Sonnet: очистка HTML-контента через Firecrawl, использование prompt caching, разделение задач между Haiku и Sonnet, умное чанкование через LlamaIndex. Особое внимание — обходу лимита 200k токенов и фильтрации данных перед отправкой в модель.

score 27r/ClaudeAI