Reddit5 мая 2026 г.

Оптимизация Qwen3.6 на RTX 3090: проблемы скорости, квантования и авто-переключения моделей

Автор поста жалуется на низкую скорость и нестабильность кода при локальном запуске Qwen3.6 (27B/35B) на RTX 3090. В обсуждении ищут оптимальные параметры llama-server, квантование и решения для автоматического роутинга между моделями.

score 17r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t49pqu/struggling_with_qwen36_27b_35b_locally_3090_slow/