Назад к дайджесту
Reddit

Бенчмарки Gemma4 E4B на iPhone 16 Pro: 20-кратный разрыв между Prefill и Decode

Пользователь тестирует запуск LLM Gemma4 E4B на iPhone 16 Pro, сравнивая CPU и GPU. Выявлено, что пропускная способность памяти ограничивает скорость декодирования, создавая разницу в 10–20 раз с Prefill. Упоминается рост прибыли корейских производителей памяти из-за спроса на HBM для ИИ.

score 30r/singularity