Reddit21 июня 2026 г.

GLM 5.2: какие скорости инференса на локальном железе?

Пользователи Reddit обмениваются данными о локальной работе с моделью GLM 5.2. В обсуждении фигурируют конфигурации железа, уровни квантования и скорость генерации токенов в секунду. Материал полезен для оценки производительности LLM на собственном оборудовании.

score 40r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1ub69xu/glm_52_what_speeds_are_we_getting_locally/