Reddit
Применение EMA к адаптерам LoRA
Пользователь ищет исследования, где Exponential Moving Average (EMA) применяется к адаптерам LoRA. Интересует сценарий самообучения, где EMA-адаптер выступает учителем для генерации мягких меток. Обсуждается эффективность метода на примере On-policy self-distillation, но требуется подтверждение именно для LoRA.
score 40r/MachineLearning