Reddit
GLM 5.2: какие скорости инференса на локальном железе?
Пользователи Reddit обмениваются данными о локальной работе с моделью GLM 5.2. В обсуждении фигурируют конфигурации железа, уровни квантования и скорость генерации токенов в секунду. Материал полезен для оценки производительности LLM на собственном оборудовании.
score 40r/LocalLLaMA