Новость
Оценка агентов Lighthouse для веб-браузинга
Тема посвящена метрикам и методам оценки автономных ИИ-агентов, способных взаимодействовать с веб-страницами. Обсуждение касается стандартизации тестирования навигационных задач для языковых моделей. Актуально для специалистов в области агентного ИИ и оценки производительности LLM.