Назад к дайджесту
Reddit

Оптимизация параметров выборки для Qwen 3.6 35B A3B

Автор обсуждает трудности настройки параметров генерации для модели Qwen 3.6, отмечая, что стандартные значения могут вызывать циклы вызова инструментов. Описывается план экспериментов с использованием различных бенчмарков и методов поиска (univariate, grid, Optuna) для улучшения качества работы модели.

score 16r/LocalLLaMA