Reddit
DeepSeek выпустила DeepEP V2 и библиотеку TileKernels
DeepSeek открыла исходный код обновлённой версии DeepEP V2 и библиотеки TileKernels для оптимизации вычислений. Инструменты предназначены для ускорения обучения и инференса больших языковых моделей, особенно в архитектуре MoE, за счёт улучшенного экспертного параллелизма. Релиз предоставляет разработчикам низкоуровневые ядра для эффективной работы с тензорами на GPU.
score 100r/LocalLLaMA