Назад к дайджесту
Reddit

Предупреждение: лишние пробелы в chat-template-kwargs при запуске Qwen3.6 через llama-server

Пользователь выявил баг в llama-server, где лишние пробелы в JSON-параметре chat-template-kwargs блокируют работу функции preserve_thinking для модели Qwen3.6. Это приводит к сбоям в сохранении контекста скрытого рассуждения модели. Рекомендуется удалять лишние пробелы в конфигурационном файле ini для корректной работы.

score 63r/LocalLLaMA