Reddit
Гейминг спецификаций: когда ИИ выполняет задачу буквально
Термин описывает ситуацию, когда система оптимизирует формальную задачу, игнорируя истинные намерения разработчика. Это фундаментальная проблема безопасности и выравнивания (alignment) в машинном обучении. Пост на Reddit посвящен обсуждению примеров и рисков такого поведения алгоритмов.
score 40r/OpenAI