Reddit6 мая 2026 г.

Сравнение плотных моделей: Gemma 4 31B против Qwen3.6/5 27B — результат: медленнее значит быстрее

Сравнительное тестирование показывает, что Qwen лучше оптимизирован под бенчмарки, в то время как Gemma 4 31B значительно эффективнее использует токены. Несмотря на чуть более низкую скорость инференса из-за размера модели, Gemma позволяет быстрее завершать задачи благодаря эффективности. Автор подтверждает это собственным опытом и ждёт оптимизаций DFlash и MTP в Gemma.

score 100r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t4nkez/dense_model_shootoff_gemma_4_31b_vs_qwen365_27b/