Назад к дайджесту
Reddit

DeepSeek выпустила DeepEP V2 и библиотеку TileKernels

DeepSeek открыла исходный код обновлённой версии DeepEP V2 и библиотеки TileKernels для оптимизации вычислений. Инструменты предназначены для ускорения обучения и инференса больших языковых моделей, особенно в архитектуре MoE, за счёт улучшенного экспертного параллелизма. Релиз предоставляет разработчикам низкоуровневые ядра для эффективной работы с тензорами на GPU.

score 100r/LocalLLaMA