Назад к дайджесту
Reddit

Сравнение квантований oQ, Q, MXFP и UD в MLX по метрике KLD

Пост на Reddit представляет сравнительный анализ методов квантования oQ, Q, MXFP и UD в фреймворке MLX. Оценка производится по метрике расхождения Кульбака-Лейблера (KLD), детальные результаты выложены в GitHub. Актуально для инженеров, работающих с оптимизацией нейросетей на Apple Silicon.

score 16r/LocalLLaMA