Назад к дайджесту
Reddit

MicroGPT от Карпати выдает 50 000 токенов в секунду на FPGA

Проект TALOS-V2 реализует версию MicroGPT (4192 параметра) на FPGA с онбордингом весов, что обеспечивает рекордную скорость инференса. Это исследование показывает перспективы специализированных FPGA для малых языковых моделей (SLM) и может стимулировать появление чипов, заточенных под ИИ.

score 74r/LocalLLaMA