Reddit
Интерактивное сравнение LLM: Qwen3.6, Gemma 4 и GLM 4.7 в соревновании по созданию гоночной игры
Автор опубликовал интерактивное соревнование языковых моделей (Qwen3.6, Gemma 4, GLM 4.7 и др.) по созданию гоночной игры с использованием Playwright MCP и подагентов. Тест выявил различия в стратегиях генерации кода, работе с ошибками и возможностях автономных агентов. Например, только GLM и Gemma 26B успешно задействовали подагентов, а Qwen3.5 27B случайно активировала движение машины.
score 20r/LocalLLaMA