Назад к дайджесту
Reddit

Применение EMA к адаптерам LoRA

Пользователь ищет исследования, где Exponential Moving Average (EMA) применяется к адаптерам LoRA. Интересует сценарий самообучения, где EMA-адаптер выступает учителем для генерации мягких меток. Обсуждается эффективность метода на примере On-policy self-distillation, но требуется подтверждение именно для LoRA.

score 40r/MachineLearning