Reddit
Оптимизация Qwen3.6 на RTX 3090: проблемы скорости, квантования и авто-переключения моделей
Автор поста жалуется на низкую скорость и нестабильность кода при локальном запуске Qwen3.6 (27B/35B) на RTX 3090. В обсуждении ищут оптимальные параметры llama-server, квантование и решения для автоматического роутинга между моделями.
score 17r/LocalLLaMA