Reddit21 апреля 2026 г.

Opus 4.7 (high) возглавил LLM Debate Benchmark, обогнав Sonnet 4.6 на 106 баллов BT

Opus 4.7 (high) заняла первое место в LLM Debate Benchmark, обогнав предыдущего чемпиона Sonnet 4.6 (high) на 106 баллов BT. Модель продемонстрировала идеальную статистику в парных дебатах: 51 победа, 4 ничьих и 0 поражений при размене сторон. Результаты подтверждены независимой панелью из трёх других моделей, избегающих семейных связей с участниками.

score 30r/ClaudeAI

reddit.comhttps://www.reddit.com/r/ClaudeAI/comments/1sr4f1b/opus_47_high_takes_1_on_the_llm_debate_benchmark/