Новость
Тест NVIDIA HGX B300: инференс LLM на 8 GPU с DeepSeek, Qwen и MiniMax
Статья описывает тестирование инференс-сервера NVIDIA HGX B300 с 8 GPU и 2,3 ТБ VRAM на реальных языковых моделях DeepSeek, Qwen и MiniMax. Автор приводит бенчмарки производительности и сравнивает эффективность с бюджетными CPU-решениями для продакшена. Материал полезен для оценки инфраструктуры под высокие нагрузки.