Reddit9 мая 2026 г.

Эксперименты с бенчмарком ARC-AGI-3

ARC-AGI — это эталонный тест на абстрактное мышление и способность к обобщению у искусственного интеллекта. В материале обсуждаются эксперименты с новой версией бенчмарка ARC-AGI-3 и результаты тестирования моделей. Это важно для оценки реального прогресса в области ИИ-рассуждений.

score 15r/singularity

reddit.comhttps://www.reddit.com/r/singularity/comments/1t7vkb1/playing_around_with_the_arcagi3_benchmark/