Reddit12 мая 2026 г.

Сборка на Intel Optane Persistent Memory: запуск модели на 1 триллион параметров со скоростью 4 токена/сек

Пользователь собрал ПК с 768 ГБ Intel Optane Persistent Memory для локального запуска модели Kimi K2.5 на 1 триллион параметров. С помощью llama.cpp и гибридного GPU/CPU инференса достигнута скорость генерации около 4 токенов в секунду. Эксперимент показывает, как использование PMem позволяет размещать огромные модели на бюджетном железе.

score 100r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1taeg8h/computer_build_using_intel_optane_persistent/