Назад к дайджесту
Reddit

SageAttention с автоматической настройкой размеров блоков

Библиотека SageAttention получила обновление с автонастройкой размеров блоков и поддержкой head dim 256 для оптимизации производительности. Автор призывает протестировать новую версию против оригинала, чтобы добиться максимальной скорости инференса на различных входных данных.

score 40r/StableDiffusion