Reddit9 мая 2026 г.

Тестирование MiMo-V2.5-IQ3_S с контекстом 1 миллион токенов

Пользователь тестирует локальный запуск LLM MiMo-V2.5 в квантованном формате GGUF с поддержкой контекста в 1 миллион токенов. Отмечена высокая скорость обработки по сравнению с Minimax, но выявлена проблема с повторением текста (looping). Планируется дальнейшее тестирование на 300k контекста.

score 16r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t7zto6/testing_mimov25iq3_s_with_1048576_context/