Reddit30 апреля 2026 г.

Что вы делаете с локальными LLM?

Автор делится опытом настройки мониторинга использования локальных LLM через LiteLLM, Prometheus и Grafana. Отмечает, что даже генерация кратких сводок в Frigate GenAI быстро расходует токены. Практический кейс по управлению затратами на инференс.

score 40r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1szdv5s/what_do_you_guys_even_use_local_llms_for_me_a_lot/