Reddit
Два похожих промпта, разные результаты: Qwen 3.5 и Gemma 4 требуют иного подхода, чем Qwen 3.6
Автор протестировал математические способности трёх LLM (Qwen 3.5, Qwen 3.6, Gemma 4) с помощью промптов разной длины. Эксперимент показал, что даже близкие версии моделей требуют разного подхода к формулировке запросов, а Gemma 4 лучше справлялась с контекстными историями. Это подтверждает, что универсальных промптов не существует и стиль запроса нужно подбирать под конкретную модель.
score 17r/LocalLLaMA