Reddit
Вы бы заплатили за независимый сервис уведомлений о дрейфе поведения LLM до того, как это заметят ваши пользователи?
Разработчик предлагает концепцию независимого сервиса мониторинга LLM, который отслеживает не только доступность API, но и дрейф качества ответов моделей. В опросе обсуждаются три уровня проверки: здоровье транспорта, канареечные тесты на функциональность и пользовательские промпты. Автор спрашивает сообщество, готовы ли они платить за такие инструменты предотвращения сбоев.
score 40r/artificial