Reddit14 мая 2026 г.

Бенчмарк RTX 5090: эффективность генерации токенов и кривые энергопотребления

Автор протестировал производительность видеокарты RTX 5090 при запуске LLM модели Qwen3.6-27B через llama.cpp. Эксперимент фокусируется на зависимости скорости генерации токенов и парсинга промптов от уровня энергопотребления в диапазоне 400–600 Вт. Результаты показывают оптимальные точки для локального развертывания нейросетей с учетом баланса мощности и скорости.

score 19r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1tcvji7/benchmark_5090rtx_promt_parsing_token_generation/