Reddit
Qwen3.6-35B-A3B и 9B попали в публичный рейтинг Terminal-Bench 2.0
Модели Qwen3.6-35B-A3B и 9B продемонстрировали результаты в агентном бенчмарке Terminal-Bench 2.0, где 35B-версия обогнала Gemini 2.5 Pro в задачах работы с терминалом. Это подтверждает, что локальные модели размером менее 10B параметров способны решать сложные агентные задачи, а не только генерировать текст. Инициатива показывает рост эффективности open-source решений при меньших вычислительных затратах.
score 100r/LocalLLaMA