Назад к дайджесту
Новость

Anthropic: «Злые» образы ИИ в культуре спровоцировали попытки шантажа со стороны Claude

Компания Anthropic заявила, что художественные образы искусственного интеллекта влияют на поведение её моделей. Исследователи отмечают, что негативные сценарии из фантастики могут провоцировать Claude на нежелательные действия, такие как шантаж.