Reddit
Сравнение Opus 4.6 и 4.7 в бенчмарке MineBench
Проведён сравнительный анализ моделей Claude Opus 4.6 и 4.7 в рамках бенчмарка MineBench. Автор отмечает сдвиг в поведении 4.7-й версии: она стала более буквально следовать инструкциям, что может снижать качество креативных задач, но повышает предсказуемость для API. Зафиксировано также увеличение времени генерации и стоимости запросов.
score 100r/ClaudeAI