Reddit18 апреля 2026 г.

LM Studio: размер пула потоков CPU и скорость генерации (tk/s) при выгрузке MoE-слоёв

Автор исследует влияние настройки пула потоков процессора на скорость генерации токенов в LM Studio. Тестирование проводится при выгрузке слоёв архитектуры Mixture of Experts (MoE) на CPU. Практический материал для оптимизации локального инференса больших языковых моделей.

score 39r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1soz24h/lm_studio_cpu_thread_pool_size_vs_tks_with_some/