Назад к дайджесту
Reddit

Эксперименты с бенчмарком ARC-AGI-3

ARC-AGI — это эталонный тест на абстрактное мышление и способность к обобщению у искусственного интеллекта. В материале обсуждаются эксперименты с новой версией бенчмарка ARC-AGI-3 и результаты тестирования моделей. Это важно для оценки реального прогресса в области ИИ-рассуждений.

score 15r/singularity