Reddit
Запуск Qwen3.6 27B для OpenCode на видеокарте 7900 XT
Автор делится настройками llama-server для эффективного запуска модели Qwen3.6 27B на 20 ГБ видеопамяти. В посте обсуждаются параметры квантования IQ4_XS и оптимизация VRAM. Также приводится сравнение эффективности с архитектурой MoE в версии 35B.
score 17r/LocalLLaMA