Reddit
Сравнение Qwen3.5, Qwen3.6 и Gemma4 в задаче распознавания иконок интерфейса
Автор провёл бенчмарк локальных моделей Qwen3.5, Qwen3.6 и Gemma4 для детекции иконок на скриншотах с использованием vLLM. Плотная модель Qwen3.5 показала лучшие результаты, в то время как MoE-архитектуры допустили критические ошибки в распознавании. Тестирование демонстрирует практическую применимость LLM в задачах компьютерного зрения.
score 12r/LocalLLaMA