Назад к дайджесту
Reddit

Сигналы: поиск наиболее информативных траекторий агентов без оценки LLM

Исследователи из Katanemo Labs представили метод «Signals» для автоматического выявления наиболее ценных траекторий работы агентов без привлечения LLM-судей. Подход позволяет анализировать взаимодействия в реальном времени, классифицируя паттерны вроде зацикливания или сбоев без использования GPU. Тестирование на τ-bench показало 82% информативности выборки, что на 50% эффективнее случайного отбора.

score 13r/MachineLearning