Назад к дайджесту
Reddit

Как на самом деле тестировать агентную систему, если половина её работы недетерминирована?

Автор обсуждает сложности тестирования AI-агентов из-за недетерминированности LLM. Приводит примеры подходов: от точного сравнения вывода до использования другой модели в качестве судьи, но указывает на проблемы с хрупкостью и переносом проблемы на другой уровень. Обсуждение актуально для инженеров, внедряющих агентов в продакшн.

score 40r/AI_Agents