Reddit
GPT 5.5 заняла первое место в приватном бенчмарке на Kaggle (задача AbstractToTitle)
На Reddit обсуждается приватный бенчмарк на Kaggle, проверяющий способность моделей точно восстанавливать заголовки научных статей по их аннотациям. Пользователи отмечают значительный скачок производительности между версиями GPT 5.4 и 5.5, что указывает на улучшение фактологической точности и памяти.
score 25r/singularity