GitHub
TokenSpeed: сверхскоростной движок для инференса LLM
TokenSpeed позиционируется как инструмент для инференса языковых моделей с экстремальной производительностью. Проект размещён на GitHub и направлен на оптимизацию генерации токенов в реальном времени.
1194 forksPythonscore 81.8
minimaxdeepseektokenspeedkimigpt-ossllmlightseekblackwellqwenspeed-of-light