Назад к дайджесту
Reddit

Luce DFlash + PFlash на AMD Strix Halo: Qwen3.6-27B быстрее llama.cpp HIP в 2.23 раза по декодированию и в 3.05 раза по префиллу

Разработчики Luce добавили поддержку DFlash и PFlash для интегрированной графики AMD Strix Halo с 128 ГБ объединённой памяти. Тесты на модели Qwen3.6-27B показали ускорение декодирования в 2.23 раза и этапа префилла в 3.05 раза по сравнению с llama.cpp HIP. Технология позволяет эффективно запускать крупные модели локально, используя возможности ROCm.

score 41r/LocalLLaMA