Загрузка...

Назад к дайджесту

Reddit24 апреля 2026 г.

Как GPT 5.5 Pro может отстать от GPT 5.4 Pro в бенчмарке HLE (с инструментами)?

Пользователь обсуждает парадоксальные результаты тестирования, где версия 5.5 Pro показывает худшие метрики, чем 5.4 Pro, в задаче с инструментами. Пост поднимает вопросы о валидности бенчмарков и возможной регрессии в будущих версиях моделей.

score 18r/OpenAI

reddit.comhttps://www.reddit.com/r/OpenAI/comments/1sua2so/how_can_gpt_55_pro_be_lower_than_gpt_54_pro_on/