Назад к дайджесту
Reddit

GPT-5.5: «самая мощная агентная модель для кодинга» терпит фиаско по данным LiveBench

Автор поста на Reddit подвергает критике заявления OpenAI о GPT-5.5 как лучшей модели для агентного кодинга. Данные независимого бенчмарка LiveBench показывают, что модель проигрывает GPT-5.4 и конкурентам, опровергая маркетинговые обещания. Обсуждение фокусируется на разрыве между заявленными возможностями и реальными результатами в задачах автономного программирования.

score 17r/artificial