Назад к дайджесту
Reddit

Сравнение версий Kimi K2.5 и K2.6 в бенчмарке MineBench

Пост сравнивает производительность моделей Kimi K2.5 и K2.6 на специализированном бенчмарке MineBench, оценивающем способность ИИ создавать 3D-структуры в стиле Minecraft. Автор отмечает высокую эффективность модели по соотношению цены и качества, но результаты работы остаются нестабильными. Предоставлены ссылки на репозиторий теста и детализация затрат.

score 95r/singularity