Назад к дайджесту
Reddit

Создать собственную диффузионную языковую модель с нуля оказалось проще, чем я ожидал

Автор реализовал диффузионную языковую модель (DLM) с нуля, обучив её на датасете Шекспира на MacBook Air M2. Модель на 7.5 млн параметров демонстрирует работу архитектуры диффузии для текста, код выложен в GitHub.

score 47r/MachineLearning