Reddit16 мая 2026 г.

Это отличная новость...

В библиотеке llama.cpp одобрена поддержка MTP (Multi-Token Prediction). Это критически важная оптимизация для скорости генерации локальных LLM. Обновление ожидается в ближайшее время.

score 100r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1teqnf2/thats_a_good_news/