Reddit
Оптимизация параметров выборки для Qwen 3.6 35B A3B
Автор обсуждает трудности настройки параметров генерации для модели Qwen 3.6, отмечая, что стандартные значения могут вызывать циклы вызова инструментов. Описывается план экспериментов с использованием различных бенчмарков и методов поиска (univariate, grid, Optuna) для улучшения качества работы модели.
score 16r/LocalLLaMA