Reddit
Различия между Opus 4.6 и Opus 4.7 в бенчмарке MineBench
Автор сравнивает производительность Claude Opus 4.6 и 4.7 на платформе MineBench, отмечая изменения в поведении версий. Версия 4.7 следует инструкциям более буквально, что повышает точность для API, но может снижать качество креативных задач. Приведены данные по времени инференса и стоимости тестирования.
score 100r/singularity