Назад к дайджесту
Reddit

Qwen Image 2.0: фундаментальная модель для генерации и редактирования изображений

Команда Qwen представила модель Image 2.0, объединяющую генерацию и редактирование изображений в едином фреймворке. Новинка использует Multimodal Diffusion Transformer и поддерживает рендеринг текста до 1000 токенов с высокой точностью. Модель значительно превосходит предыдущие версии в фотореализме и следовании сложным инструкциям.

score 47r/StableDiffusion