Назад к дайджесту
Reddit

Cyankiwi AWQ: новое обновление 4-битного квантования

Метод cyankiwi AWQ улучшает стандартное квантование за счёт совместной оптимизации масштабов и диапазонов квантования, устраняя ошибки округления. Тесты на моделях Llama-3 показали наивысшую точность (минимальную KL Divergence) по сравнению с BNB, GPTQ и NVFP4. Обновление обещает более эффективное развёртывание LLM без потери качества.

score 17r/LocalLLaMA