Reddit
Когда в llama.cpp появится официальная поддержка MTP?
Пользователь Reddit спрашивает о сроках официальной поддержки технологии Multi-Token Prediction (MTP) в библиотеке llama.cpp, особенно для GPU AMD (Vulkan/HIP). Запрос связан с трудностями сборки на Windows 11 и поиском стабильного релиза для локального запуска LLM.
score 59r/LocalLLaMA