Reddit14 мая 2026 г.

Qwen 3.6 27B на AMD MI50: 52.8 токена/сек генерации и 1569 токенов/сек промпта без квантования

Автор протестировал запуск модели Qwen 3.6 27B на видеокартах AMD MI50 с использованием кастомного форка vLLM и ROCm 7.2.1. Достигнуты показатели 52.8 токена в секунду при генерации и 1569 токенов в секунду при обработке промпта в полном точностном режиме. Результаты подтверждают пригодность модели для агентов и указывают на потенциал дальнейшего ускорения через оптимизацию стека.

score 100r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1tc9j6u/mi50s_qwen_36_27b_528_tps_tg_1569_tps_pp_no_mtp/