Назад к дайджесту
Reddit

Тестирование MiMo-V2.5-IQ3_S с контекстом 1 миллион токенов

Пользователь тестирует локальный запуск LLM MiMo-V2.5 в квантованном формате GGUF с поддержкой контекста в 1 миллион токенов. Отмечена высокая скорость обработки по сравнению с Minimax, но выявлена проблема с повторением текста (looping). Планируется дальнейшее тестирование на 300k контекста.

score 16r/LocalLLaMA