Назад к дайджесту
Reddit

vLLM PR: Скоро поддержка новой MoE-модели от Cohere

В репозитории vLLM появился запрос на слияние, касающийся добавления поддержки новой модели Mixture of Experts (MoE) от компании Cohere. Это обновление критично для разработчиков, использующих vLLM для оптимизации инференса больших языковых моделей.

score 40r/LocalLLaMA