Reddit
Как сэкономить 80% на счёте за Claude с помощью оптимизации контекста
Автор делится практическими приёмами снижения расходов при работе с Claude 4.6 Sonnet: очистка HTML-контента через Firecrawl, использование prompt caching, разделение задач между Haiku и Sonnet, умное чанкование через LlamaIndex. Особое внимание — обходу лимита 200k токенов и фильтрации данных перед отправкой в модель.
score 27r/ClaudeAI