Reddit8 мая 2026 г.

Z Lab выпустила DFlash для Gemma 4 26B. Кто уже пробовал?

Z Lab представила DFlash — оптимизацию для Gemma 4 26B, использующую параллельную диффузию блоков и сохраняющую состояние между итерациями для ускорения работы с длинным контекстом. В отличие от MTP, метод должен меньше деградировать при росте контекста, но пока доступен только через vLLM. Сообщество обсуждает потенциальный прирост скорости и перспективы поддержки в lcpp.

score 95r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t79ayh/zlab_released_gemma426ba4bitdflash_anybody_tried/