Reddit17 июня 2026 г.

Как на самом деле тестировать агентную систему, если половина её работы недетерминирована?

Автор обсуждает сложности тестирования AI-агентов из-за недетерминированности LLM. Приводит примеры подходов: от точного сравнения вывода до использования другой модели в качестве судьи, но указывает на проблемы с хрупкостью и переносом проблемы на другой уровень. Обсуждение актуально для инженеров, внедряющих агентов в продакшн.

score 40r/AI_Agents

reddit.comhttps://www.reddit.com/r/AI_Agents/comments/1u7p3ph/how_do_you_actually_test_an_agent_harness_when/