Назад к дайджесту
Reddit

GLM 5.2: какие скорости инференса на локальном железе?

Пользователи Reddit обмениваются данными о локальной работе с моделью GLM 5.2. В обсуждении фигурируют конфигурации железа, уровни квантования и скорость генерации токенов в секунду. Материал полезен для оценки производительности LLM на собственном оборудовании.

score 40r/LocalLLaMA