Назад к дайджесту
Reddit

XiaomiMiMo MiMo-V2.5 (не Pro): архитектура Sparse MoE, 310 млрд параметров, 15 млрд активных

XiaomiMiMo представила модель MiMo-V2.5 с архитектурой Sparse MoE, где из 310 миллиардов параметров активируются только 15 миллиардов. Ключевая особенность — возможность запуска на стандартном потребительском оборудовании, в отличие от более мощной версии. Это важный шаг для доступности больших языковых моделей на локальных устройствах.

score 37r/LocalLLaMA