Reddit15 мая 2026 г.

Почему llama.cpp на ROCm потребляет больше VRAM для KV-кэша, чем на Vulkan?

Пользователь сравнивает потребление видеопамяти в llama.cpp при использовании бэкендов ROCm и Vulkan на Linux. Выяснилось, что ROCm требует значительно больше VRAM для хранения KV-кэша (29.1 ГБ против 25.3 ГБ) при идентичных настройках модели. Автор спрашивает, является ли это особенностью его железа или неэффективностью реализации бэкенда.

score 28r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1td6et1/linux_why_does_llamacpp_rocm_consume_so_much_vram/