Назад к дайджесту
Reddit

GPT-4.5 в MineBench отказалась выполнять запрос, выдав вместо результата слово «HELP»

Пользователь столкнулся с аномалией при тестировании GPT-4.5 на бенчмарке MineBench: модель вместо генерации «небоскрёба» выдала слово «HELP». После 30 попыток генерация прошла успешно, что вызывает вопросы о причинах такого поведения в обучающих данных.

score 40r/OpenAI