Назад к дайджесту
Reddit

Критика исследования: тест Роршаха на LLM и проблема contamination данных

Пользователь Reddit обсуждает статью о применении теста Роршаха к мультимодальным LLM (GPT-4o, Grok 3, Gemini 2.0), ставя под сомнение её научную ценность. Основной аргумент — загрязнение данных: модели могли просто запомнить карточки и ответы из обучающей выборки, а не демонстрировать реальное восприятие образов. Поднимается вопрос о методологической валидности тестирования ИИ на стандартных психологических стимулах без контроля contamination.

score 15r/MachineLearning