Reddit28 апреля 2026 г.

Две RTX 5060 Ti: есть ли лучшие конфигурации для Qwen 3.6 27B / 35B?

Пользователь делится результатами тестирования моделей Qwen 3.6 (27B и 35B) на конфигурации из двух видеокарт RTX 5060 Ti 16 ГБ. В материале приведены детальные бенчмарки производительности для vLLM и llama.cpp с различными методами квантования, включая неудачные попытки speculative decoding. Обсуждаются ограничения PCIe-полосы и поиск оптимальных настроек для локального запуска больших языковых моделей.

score 33r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1sxe861/2_x_5060_ti_any_better_configs_for_qwen_36_27b_35b/