Reddit
Сравнение квантований oQ, Q, MXFP и UD в MLX по метрике KLD
Пост на Reddit представляет сравнительный анализ методов квантования oQ, Q, MXFP и UD в фреймворке MLX. Оценка производится по метрике расхождения Кульбака-Лейблера (KLD), детальные результаты выложены в GitHub. Актуально для инженеров, работающих с оптимизацией нейросетей на Apple Silicon.
score 16r/LocalLLaMA