Reddit
Кто использует модели для описания изображений и генерации промптов? Сравнение Qwen 3.5 и Gemma 4
Пользователи Reddit обсуждают эффективность различных мультимодальных моделей (Qwen, Gemma, JoyCaption) для создания описаний изображений под генерацию картинок. Отмечается компромисс между детализацией и реализмом: одни модели дают слишком вычурные описания, другие — слишком сухие.
score 16r/StableDiffusion