Reddit
Открытых весов недостаточно: нужны открытые фреймворки для обучения, исследований и улучшения алгоритмов
Автор аргументирует, что для развития ML недостаточно открытых весов, требуются открытые фреймворки обучения. Представлен проект FeynRL — инструмент для RL пост-обучения LLM и VLM, делающий процесс тренировки прозрачным и модифицируемым. Фреймворк поддерживает SFT, DPO и различные конфигурации оборудования для упрощения разработки новых алгоритмов.
score 55r/MachineLearning