Reddit
XiaomiMiMo MiMo-V2.5 (не Pro): архитектура Sparse MoE, 310 млрд параметров, 15 млрд активных
XiaomiMiMo представила модель MiMo-V2.5 с архитектурой Sparse MoE, где из 310 миллиардов параметров активируются только 15 миллиардов. Ключевая особенность — возможность запуска на стандартном потребительском оборудовании, в отличие от более мощной версии. Это важный шаг для доступности больших языковых моделей на локальных устройствах.
score 37r/LocalLLaMA