Назад к дайджесту
Reddit

Как на самом деле ощущается скорость генерации в токенах в секунду

Автор разработал веб-инструмент для субъективной оценки скорости генерации локальных LLM, так как сухие цифры токенов в секунду не передают реального опыта работы. Скрипт позволяет на практике оценить производительность моделей, поддерживая генерацию текста, кода и рассуждений.

score 100r/LocalLLaMA