Назад к дайджесту
Reddit

Различия между Kimi K2.5 и K2.6 в бенчмарке MineBench

Пост сравнивает производительность двух версий модели Kimi (K2.5 и K2.6) на специализированном бенчмарке MineBench, который тестирует способность ИИ создавать 3D-структуры в стиле Minecraft. Автор отмечает высокую эффективность модели по соотношению цена/качество, но указывает на нестабильность результатов.

score 100r/LocalLLaMA