GitHub
SAP: Инструмент оценки качества AI-агентов
Это пакет для бенчмаркинга и оценки качества агентов ИИ из различных источников и фреймворков. Инструмент генерирует статистические результаты, позволяя сравнивать эффективность систем на разных задачах и наборах данных.
720 forksPythonscore 65.7
user-proxymetricsevaluationagentic-aillm-as-a-judgellmerror-analysis