Reddit6 мая 2026 г.

DeepSeek V4 Pro сравнялся с GPT-5.2 в агентных задачах, обойдя конкурентов по цене в 17 раз

Независимый тест DeepSeek V4 Pro на агентном бенчмарке FoodTruck Bench показал паритет с GPT-5.2 и Grok 4.3, при этом стоимость API оказалась в 17 раз ниже. Модель заняла второе место по эффективности затрат, уступив только Gemma 4 31B, и продемонстрировала высокую стабильность в задачах управления виртуальным бизнесом.

score 100r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t47qbw/deepseek_v4_pro_matches_gpt52_on_foodtruck_bench/