Назад к дайджесту
Reddit

Безопасен ли контент? (Могут ли обычные запросы изображений срабатывать как угрозы?)

Автор исследует работу систем безопасности ИИ, проверяя, могут ли нормальные запросы изображений ошибочно триггерить фильтры защиты. Обсуждается, насколько глубоко контекстная защита анализирует изображения, и приводятся результаты тестов с метаданными. Это важный кейс для понимания уязвимостей модерации в генеративных моделях.

score 100r/ChatGPT