Назад к дайджесту
Reddit

GLM 5.2 выглядит сильным, но запуск смешивает два разных набора метрик

Zhipu AI выпустила модель GLM 5.2 с открытыми весами, однако маркетинг использует избирательные бенчмарки для создания завышенного впечатления. В официальной документации модель показывает результаты ниже, чем заявлено в пресс-релизе, особенно в задачах по программированию. Автор поста разбирает разницу между реальными метриками и рекламными заявлениями, подчеркивая важность проверки данных.

score 55r/artificial