Назад к дайджесту
Reddit

Где провести границу безопасности для агентов, использующих инструменты?

Пост посвящён вопросам безопасности агентов, способных взаимодействовать с внешними системами через API или файлы. Автор указывает, что главная угроза — не генерация текста, а инъекция промптов, меняющая действия агента, и делится опытом тестирования таких сценариев. Обсуждается, как сообщество проверяет агентов перед предоставлением им реальных прав доступа.

score 40r/AI_Agents