Reddit4 мая 2026 г.

M3 Ultra + DGX Spark: получится ли M5 Ultra-lite?

Автор тестирует NVIDIA DGX Spark против Apple M3 Ultra для инференса больших языковых моделей через llama.cpp. Результаты показывают, что Spark обеспечивает в 1.4–3.4 раза более высокую скорость префилла, становясь эффективной альтернативой для локального запуска ИИ. В материале также есть практические советы по настройке, например, отключение mmap для ускорения загрузки моделей.

score 14r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t3j126/m3_ultra_dgx_spark_m5_ultralite/