Назад к дайджесту
Reddit

Бэнчмарк локальных LLM: генерация бэкенда через Function Calling (GLM vs Qwen vs DeepSeek)

Автор представил обновлённый строгий бэнчмарк локальных LLM для генерации бэкенда через Function Calling, сравнивая GLM, Qwen и DeepSeek. Результаты показывают, что локальные модели вроде Qwen3.5-35b практически догнали проприетарные аналоги в задачах дизайна API и баз данных. Эксперимент также выявил неожиданные инверсии в производительности и ограничил тестирование дорогих моделей из-за высокой стоимости.

score 15r/LocalLLaMA