Назад к дайджесту
Reddit

ROCm с PyTorch и Lightning всё ещё не подходят для исследований

Исследователь протестировал AMD RX 7900XTX с ROCm и PyTorch для обучения моделей Flow Matching и столкнулся с критическими ошибками при обратном распространении. В отличие от CUDA, где код работал стабильно, на ROCm возникали NaN даже при идентичной настройке окружения. Вывод: платформа пока недостаточно стабильна для нестандартных исследовательских задач.

score 22r/MachineLearning