Reddit16 мая 2026 г.

Поддержка MTP добавлена в llama.cpp

В библиотеку llama.cpp добавлена поддержка Multi-Token Prediction (MTP). Это позволяет ускорить инференс LLM, предсказывая несколько токенов за один шаг генерации.

score 100r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1tes1wx/mtp_support_merged_into_llamacpp/