Reddit
SageAttention с автоматической настройкой размеров блоков
Библиотека SageAttention получила обновление с автонастройкой размеров блоков и поддержкой head dim 256 для оптимизации производительности. Автор призывает протестировать новую версию против оригинала, чтобы добиться максимальной скорости инференса на различных входных данных.
score 40r/StableDiffusion