Reddit
Устал вручную отлаживать трассы выполнения агентов
Автор делится проблемой нестабильного поведения AI-агентов и предлагает инструмент для сравнения реплея с эталонным запуском. Обсуждаются методы отладки: LangSmith, Langfuse, evals и кастомные логи. Запрос аудитории о лучших практиках выявления дрейфа в работе нейросетевых агентов.
score 40r/AI_Agents