Назад к дайджесту
Reddit

Гибридный локальный инференс на Android: llama.cpp + LiteRT + маршрутизация NPU/GPU

Разработчик представил проект Box — полностью оффлайн AI-ассистент для Android, объединяющий llama.cpp, whisper.cpp и stable-diffusion.cpp в едином приложении. Ключевой фокус на гибридной архитектуре инференса с автоматическим выбором оборудования (CPU/GPU/NPU) и оптимизации памяти на мобильных устройствах.

score 31r/LocalLLaMA