Reddit14 мая 2026 г.

Мы точно справимся: опыт настройки локального ИИ на двух RTX 3090

Автор отчитывается о запуске локальных LLM на двух видеокартах RTX 3090, используя патчи Sonnet для исправления ошибок. После перехода на Ubuntu он достиг скорости 113 токенов в секунду и 4000 prompt tokens в секунду, успешно тестируя модель Qwen 3.6 27b для кода и задач.

score 17r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1tcf2dt/we_really_all_are_going_to_make_it_arent_we/