Reddit
Кто-то реально построил петлю обратной связи для агентов Claude в продакшене? «Запускай evals и молись» больше не работает
Пользователь описывает проблемы с тестированием и мониторингом многоагентных систем на базе Claude в продакшене. Отсутствие автоматизированных петлей обратной связи вынуждает команды полагаться на ручную археологию логов после инцидентов, так как традиционные методы CI/CD не работают с недетерминированными выводами ИИ. Обсуждается потребность в инструментах, отслеживающих поведенческий дрейф агентов до обращения клиентов.
score 23r/AI_Agents