Reddit
Эксперименты с бенчмарком ARC-AGI-3
ARC-AGI — это эталонный тест на абстрактное мышление и способность к обобщению у искусственного интеллекта. В материале обсуждаются эксперименты с новой версией бенчмарка ARC-AGI-3 и результаты тестирования моделей. Это важно для оценки реального прогресса в области ИИ-рассуждений.
score 15r/singularity