Назад к дайджесту
Reddit

SubQ: заявленный прорыв в архитектуре LLM с контекстом 12M токенов

В Reddit обсуждают заявление о новой архитектуре SubQ, обещающей 12M контекста, скорость в 52 раза выше FlashAttention и низкую стоимость. Автор поста сомневается в реальности прорыва из-за отсутствия кода, статей или API для тестирования.

score 21r/LocalLLaMA