Reddit
Cola-DLM: диффузионная языковая модель с непрерывным латентным пространством
ByteDance представила Cola-DLM — иерархическую языковую модель, использующую диффузию в непрерывном латентном пространстве вместо дискретных токенов. Архитектура сочетает Text VAE и Diffusion Transformer (DiT) с Flow Matching для переноса латентного распределения. Модель доступна на Hugging Face с открытой лицензией Apache 2.0.
score 28r/LocalLLaMA