Reddit26 апреля 2026 г.

GPT 5.5 набрала 1,7% на тесте OpenAI-proof Q&A — внутренний бенчмарк, проверяющий работу с реальными ML-задачами в процессе исследований и инженерии

В Reddit-сообществе обсуждается утверждение о том, что модель GPT 5.5 показала крайне низкий результат (1,7%) на специализированном тесте, имитирующем реальные инженерные и исследовательские проблемы машинного обучения. Материал касается производительности LLM и бенчмарков, даже если версия модели не подтверждена официально.

score 98r/singularity

reddit.comhttps://www.reddit.com/r/singularity/comments/1stumgg/gpt_55_scores_17_on_openaiproof_qaan_internal/