Reddit
LLM эффективно решают ARC-AGI-3 при поиске по игровым логам
Исследование показывает, что фронтальные модели (Opus 4.6, GPT-5.2) значительно улучшают результаты на ARC-AGI-3, если разрешить им искать по игровым логам с помощью инструментов. Такой подход сокращает разрыв с человеком до 900 действий и позволяет решать задачи алгоритмического планирования, например, через решение линейных систем. Это подтверждает критическую важность внешних инструментов и поиска для сложных когнитивных задач.
score 69r/singularity