Reddit
Оптимизация GPU: влияние лимита мощности и частот на генерацию LLM
Автор тестирует влияние настроек MSI Afterburner на скорость генерации токенов в модели Qwen3.5:9b. Увеличение памяти на 700-1000 МГц даёт умеренный прирост скорости, хотя влияние лимита мощности остаётся не до конца ясным. Практический эксперимент для энтузиастов локального запуска нейросетей.
score 35r/LocalLLaMA