Назад к дайджесту
Reddit

DeepSeek V4 Pro сравнялся с GPT-5.2 в агентных задачах, обойдя конкурентов по цене в 17 раз

Независимый тест DeepSeek V4 Pro на агентном бенчмарке FoodTruck Bench показал паритет с GPT-5.2 и Grok 4.3, при этом стоимость API оказалась в 17 раз ниже. Модель заняла второе место по эффективности затрат, уступив только Gemma 4 31B, и продемонстрировала высокую стабильность в задачах управления виртуальным бизнесом.

score 100r/LocalLLaMA