Reddit
Тестирование MiMo-V2.5-IQ3_S с контекстом 1 миллион токенов
Пользователь тестирует локальный запуск LLM MiMo-V2.5 в квантованном формате GGUF с поддержкой контекста в 1 миллион токенов. Отмечена высокая скорость обработки по сравнению с Minimax, но выявлена проблема с повторением текста (looping). Планируется дальнейшее тестирование на 300k контекста.
score 16r/LocalLLaMA