Reddit
REAP-прунинг Nemotron-3-Super (512 -> 256 экспертов) + GRPO + FP8/AWQ. AIME 2026 90%+
Выложена оптимизированная версия Nemotron-3-Super-120B: модель прунена с 512 до 256 экспертов (REAP) и дообучена через GRPO на математических задачах. Результат — 90%+ на AIME 2026 при запуске на одной видеокарте H100 или RTX PRO 6000 Blackwell. Предоставлены веса в BF16, FP8 и AWQ с патчем для vLLM.
score 20r/LocalLLaMA