Назад к дайджесту
Reddit

Как предотвратить зацикливание модели

Пользователь описывает проблему зацикливания LLM-модели Qwen 35b при интеграции с инструментами вроде Copilot или Hermes. Модель генерирует избыточно длинные ответы или ошибочные вызовы инструментов во время выполнения задачи. Проблема сохраняется даже после добавления нового GPU.

score 24r/LocalLLaMA