Reddit12 мая 2026 г.

GPT-5.5 выявила фатальные ошибки в задачах FrontierMath

Команда Epoch с помощью ИИ-ассистента нашла фатальные ошибки в трети задач сложного бенчмарка FrontierMath. Первичные сигналы об ошибках поступили от модели GPT-5.5, что подтверждает её способность проверять качество тестовых наборов. Окончательные оценки будут пересчитаны после исправления найденных проблем.

score 100r/singularity

reddit.comhttps://www.reddit.com/r/singularity/comments/1taue3z/gpt55_was_used_to_flag_fatal_errors_in/