Назад к дайджесту
Reddit

Кто использует модели для описания изображений и генерации промптов? Сравнение Qwen 3.5 и Gemma 4

Пользователи Reddit обсуждают эффективность различных мультимодальных моделей (Qwen, Gemma, JoyCaption) для создания описаний изображений под генерацию картинок. Отмечается компромисс между детализацией и реализмом: одни модели дают слишком вычурные описания, другие — слишком сухие.

score 16r/StableDiffusion