Назад к дайджесту
Reddit

Subquadratic AI представила модель SubQ-1.1-Small с механизмом Smart Sparse Attention

Компания Subquadratic AI выпустила модель SubQ-1.1-Small, использующую механизм Smart Sparse Attention для обработки контекста до 12 миллионов токенов. Архитектура снижает вычислительные затраты на внимание до 1000 раз и работает в 56 раз быстрее FlashAttention-2 при сохранении качества рассуждений и кодинга.

score 40r/singularity