Назад к дайджесту
Reddit

ServiceNow представила Supernet-модель SuperApriel-15B с 8 пресетами развертывания

ServiceNow открыла модель SuperApriel-15B, основанную на архитектуре token-mixer supernet с 48 слоями декодера. Модель поддерживает контекст до 262K токенов и предлагает 8 пресетов для оптимизации скорости декодирования от 1.0x до 10.7x. Также реализована поддержка speculative decoding для ускорения генерации.

score 27r/LocalLLaMA