Reddit
Сравнение плотных моделей: Gemma 4 31B против Qwen3.6/5 27B — результат: медленнее значит быстрее
Сравнительное тестирование показывает, что Qwen лучше оптимизирован под бенчмарки, в то время как Gemma 4 31B значительно эффективнее использует токены. Несмотря на чуть более низкую скорость инференса из-за размера модели, Gemma позволяет быстрее завершать задачи благодаря эффективности. Автор подтверждает это собственным опытом и ждёт оптимизаций DFlash и MTP в Gemma.
score 100r/LocalLLaMA