Reddit5 мая 2026 г.

Поддержка MTP в llama.cpp перешла в бета-версию

Библиотека llama.cpp выпустила бета-версию поддержки многозадачного предсказания токенов (MTP). Изначально реализована для моделей Qwen3.5, но планируется расширение на другие архитектуры. Это обещает сократить разрыв в скорости генерации с vLLM благодаря развитию параллельной обработки тензоров.

score 100r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t3guzw/llamacpp_mtp_support_now_in_beta/