Reddit
Агентства Five Eyes выпустили первое согласованное руководство по безопасности агентного ИИ
Агентства Five Eyes (США, Великобритания, Канада, Австралия, Новая Зеландия) впервые выпустили совместное руководство по безопасности автономных AI-агентов, смещая фокус с рисков на уровне моделей на риски системной автономии. В материале также рассматриваются новые подходы Anthropic к классификации сycophancy в Claude, оценка кибервозможностей GPT-5.5 и исследование Гарварда о точности диагностики ИИ в сравнении с врачами.
score 30r/singularity