Reddit
Сравнение версий Kimi K2.5 и K2.6 в бенчмарке MineBench
Пост сравнивает производительность моделей Kimi K2.5 и K2.6 на специализированном бенчмарке MineBench, оценивающем способность ИИ создавать 3D-структуры в стиле Minecraft. Автор отмечает высокую эффективность модели по соотношению цены и качества, но результаты работы остаются нестабильными. Предоставлены ссылки на репозиторий теста и детализация затрат.
score 95r/singularity