Назад к дайджесту
Reddit

Когда в llama.cpp появится официальная поддержка MTP?

Пользователь Reddit спрашивает о сроках официальной поддержки технологии Multi-Token Prediction (MTP) в библиотеке llama.cpp, особенно для GPU AMD (Vulkan/HIP). Запрос связан с трудностями сборки на Windows 11 и поиском стабильного релиза для локального запуска LLM.

score 59r/LocalLLaMA