Назад к дайджесту
Reddit

GLM-5.2 в бенчмарке DeepSWE: обходит Gemini и GPT-5.4, но избыток токенов делает его экономически невыгодным

Новая open-weight модель GLM-5.2 продемонстрировала превосходство над GPT-5.4 и Gemini в задачах программирования на платформе DeepSWE. Тем не менее, из-за огромного объема генерируемых токенов её использование оказывается экономически нецелесообразным. Более эффективными по соотношению цены и качества остаются GPT-5.5 и Claude Opus 4.8.

score 40r/LocalLLaMA