Назад к дайджесту
Reddit

HiDream-O1-Image: модель пиксельного пространства без VAE, 8B параметров

HiDream-O1-Image — это новая генеративная модель для изображений, построенная на Pixel-level Unified Transformer (UiT) без использования внешних VAE. Она поддерживает генерацию до 2048×2048 пикселей, редактирование и персонализацию, при этом имея всего 8 миллиардов параметров. Модель объединяет кодирование текста и пикселей в едином пространстве токенов.

score 59r/StableDiffusion