Загрузка...

Назад к дайджесту

Reddit15 мая 2026 г.

Исправление Flash Attention для RDNA3 выпущено в llama.cpp

Библиотека llama.cpp выпустила обновление с исправлением для Flash Attention на архитектуре AMD RDNA3. Это критично для оптимизации инференса LLM на видеокартах AMD. Изменение доступно в последнем релизе на GitHub.

score 48r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1tdgtdu/rdna3_flash_attention_fix_just_dropped_by/