Назад к дайджесту
Reddit

Различия между Opus 4.6 и Opus 4.7 в бенчмарке MineBench

Автор сравнивает производительность Claude Opus 4.6 и 4.7 на платформе MineBench, отмечая изменения в поведении версий. Версия 4.7 следует инструкциям более буквально, что повышает точность для API, но может снижать качество креативных задач. Приведены данные по времени инференса и стоимости тестирования.

score 100r/singularity