Назад к дайджесту
Reddit

Бенчмарк RTX 5090: эффективность генерации токенов и кривые энергопотребления

Автор протестировал производительность видеокарты RTX 5090 при запуске LLM модели Qwen3.6-27B через llama.cpp. Эксперимент фокусируется на зависимости скорости генерации токенов и парсинга промптов от уровня энергопотребления в диапазоне 400–600 Вт. Результаты показывают оптимальные точки для локального развертывания нейросетей с учетом баланса мощности и скорости.

score 19r/LocalLLaMA