GitHub4 июня 2026 г.

Подборка материалов по on-policy дистилляции больших языковых моделей

Это GitHub-репозиторий с курируемой коллекцией научных статей и ресурсов, посвящённых методу дистилляции знаний для больших языковых моделей. Особый акцент сделан на технике on-policy distillation, позволяющей эффективно обучать модели-ученики на траекториях от моделей-учителей. Ресурс будет полезен исследователям и инженерам, изучающим способы оптимизации и сжатия LLM.

2335 forksPythonscore 77.3

surveyawesome-opdon-policy-distillationrlhfawesome-listgithub-pagesopdhubopdlarge-language-modelsopd-survey

nick7nlp/Awesome-LLM-On-Policy-Distillationhttps://github.com/nick7nlp/Awesome-LLM-On-Policy-Distillation