Reddit
Как предотвратить зацикливание модели
Пользователь описывает проблему зацикливания LLM-модели Qwen 35b при интеграции с инструментами вроде Copilot или Hermes. Модель генерирует избыточно длинные ответы или ошибочные вызовы инструментов во время выполнения задачи. Проблема сохраняется даже после добавления нового GPU.
score 24r/LocalLLaMA