Назад к дайджесту
Reddit

Обновление ARC-AGI-3: тесты GPT-5.5 и Opus4.7

Пост обсуждает результаты тестирования моделей GPT-5.5 и Opus4.7 на бенчмарке ARC-AGI-3, где они показали крайне низкие показатели. Автор выражает ожидание, что реальные модели наконец справятся с задачей абстрактного мышления. Указанные версии нейросетей официально не существуют, что делает материал спекулятивным.

score 100r/singularity