Назад к дайджесту
Reddit

Открытых весов недостаточно: нужны открытые фреймворки для обучения, исследований и улучшения алгоритмов

Автор аргументирует, что для развития ML недостаточно открытых весов, требуются открытые фреймворки обучения. Представлен проект FeynRL — инструмент для RL пост-обучения LLM и VLM, делающий процесс тренировки прозрачным и модифицируемым. Фреймворк поддерживает SFT, DPO и различные конфигурации оборудования для упрощения разработки новых алгоритмов.

score 55r/MachineLearning