Reddit12 мая 2026 г.

Artificial Analysis представила индекс Coding Agent Index: сравнение моделей и сред

Сервис Artificial Analysis запустил новый индекс для оценки кодинговых агентов, включающий три ключевых бенчмарка: SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 и SWE-Atlas-QnA. Инструмент позволяет сравнивать производительность различных моделей и сред выполнения на реальных задачах программирования и системного администрирования.

score 79r/singularity

reddit.comhttps://www.reddit.com/r/singularity/comments/1tak39d/aa_introduces_coding_agent_index_performance/