Назад к дайджесту
Reddit

DeepSeek V4 вышла: 1,6 трлн параметров, 1 млн контекста и MIT-лицензия

DeepSeek выпустила V4 с двумя версиями: Pro (1,6T параметров, 49B активных) и Flash (284B параметров, 13B активных). Обе модели имеют 1M контекстного окна и распространяются под MIT-лицензией, что делает их доступными для self-hosted развертывания. Это крупнейший релиз open-weight моделей в этом году, способный изменить экономику инференса и маршрутизацию запросов.

score 30r/LocalLLaMA