Назад к дайджесту
GitHub

SAP: Инструмент оценки качества AI-агентов

Это пакет для бенчмаркинга и оценки качества агентов ИИ из различных источников и фреймворков. Инструмент генерирует статистические результаты, позволяя сравнивать эффективность систем на разных задачах и наборах данных.

720 forksPythonscore 65.7
user-proxymetricsevaluationagentic-aillm-as-a-judgellmerror-analysis