Reddit13 мая 2026 г.

Luce DFlash + PFlash на AMD Strix Halo: Qwen3.6-27B быстрее llama.cpp HIP в 2.23 раза по декодированию и в 3.05 раза по префиллу

Разработчики Luce добавили поддержку DFlash и PFlash для интегрированной графики AMD Strix Halo с 128 ГБ объединённой памяти. Тесты на модели Qwen3.6-27B показали ускорение декодирования в 2.23 раза и этапа префилла в 3.05 раза по сравнению с llama.cpp HIP. Технология позволяет эффективно запускать крупные модели локально, используя возможности ROCm.

score 41r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1tb9pwn/luce_dflash_pflash_on_amd_strix_halo_qwen3627b_at/