Reddit
Бесплатный 15-частный гайд по внутреннему устройству LLM: математика, тензоры и аппаратные ограничения на примере Gemma 4 12B
Автор создал бесплатный 15-частный гайд по внутреннему устройству LLM, раскрывающий математику, тензоры и аппаратные ограничения на примере Gemma 4 12B. Материалы охватывают всё: от токенизации и механизмов внимания до расчёта памяти GPU и методов тонкой настройки вроде LoRA и QLoRA. Это глубокое техническое руководство для инженеров, желающих понять работу нейросетей «под капотом».
score 40r/LocalLLaMA