Reddit
Opus 4.7: Кривая рассуждений на 29 реальных задачах из открытого репозитория
Автор протестировал модель Opus 4.7 в режиме Claude Code на 29 задачах по коду, сравнивая настройки усилий на рассуждения от Low до Max. Результаты показали, что увеличение усилий не линейно улучшает качество: пик эффективности достигается на уровне Medium, тогда как High и Max лишь увеличивают затраты без роста метрик. В отличие от GPT-5.5, где больше рассуждений давало лучший результат, Opus использует адаптивное мышление, делающее ручное регулирование неэффективным.
score 33r/ClaudeAI