GitHub20 апреля 2026 г.

SAP: Инструмент оценки качества AI-агентов

Это пакет для бенчмаркинга и оценки качества агентов ИИ из различных источников и фреймворков. Инструмент генерирует статистические результаты, позволяя сравнивать эффективность систем на разных задачах и наборах данных.

720 forksPythonscore 65.7

user-proxymetricsevaluationagentic-aillm-as-a-judgellmerror-analysis

SAP/agent-quality-inspecthttps://github.com/SAP/agent-quality-inspect