Назад к дайджесту
Reddit

Сравнение Qwen3.5, Qwen3.6 и Gemma4 в задаче распознавания иконок интерфейса

Автор провёл бенчмарк локальных моделей Qwen3.5, Qwen3.6 и Gemma4 для детекции иконок на скриншотах с использованием vLLM. Плотная модель Qwen3.5 показала лучшие результаты, в то время как MoE-архитектуры допустили критические ошибки в распознавании. Тестирование демонстрирует практическую применимость LLM в задачах компьютерного зрения.

score 12r/LocalLLaMA