Reddit
M3 Ultra + DGX Spark: получится ли M5 Ultra-lite?
Автор тестирует NVIDIA DGX Spark против Apple M3 Ultra для инференса больших языковых моделей через llama.cpp. Результаты показывают, что Spark обеспечивает в 1.4–3.4 раза более высокую скорость префилла, становясь эффективной альтернативой для локального запуска ИИ. В материале также есть практические советы по настройке, например, отключение mmap для ускорения загрузки моделей.
score 14r/LocalLLaMA