Reddit29 апреля 2026 г.

Критика исследования: тест Роршаха на LLM и проблема contamination данных

Пользователь Reddit обсуждает статью о применении теста Роршаха к мультимодальным LLM (GPT-4o, Grok 3, Gemini 2.0), ставя под сомнение её научную ценность. Основной аргумент — загрязнение данных: модели могли просто запомнить карточки и ответы из обучающей выборки, а не демонстрировать реальное восприятие образов. Поднимается вопрос о методологической валидности тестирования ИИ на стандартных психологических стимулах без контроля contamination.

score 15r/MachineLearning

reddit.comhttps://www.reddit.com/r/MachineLearning/comments/1syc6ee/what_is_the_scientific_value_of_administering_the/