Назад к дайджесту
Reddit

Кто-то реально построил петлю обратной связи для агентов Claude в продакшене? «Запускай evals и молись» больше не работает

Пользователь описывает проблемы с тестированием и мониторингом многоагентных систем на базе Claude в продакшене. Отсутствие автоматизированных петлей обратной связи вынуждает команды полагаться на ручную археологию логов после инцидентов, так как традиционные методы CI/CD не работают с недетерминированными выводами ИИ. Обсуждается потребность в инструментах, отслеживающих поведенческий дрейф агентов до обращения клиентов.

score 23r/AI_Agents