Reddit
Sage Attention с заголовком 256 теперь доступен для Ideogram
Разработчик выложил готовые бинарные пакеты для Windows с реализацией механизма Sage Attention. Заявлено ускорение инференса на 25% по сравнению с Flash Attention 2 на видеокарте RTX 5090.
score 40r/StableDiffusion