Reddit
Гайд по созданию голосовых агентов с нуля: полный локальный пайплайн Whisper, LLM и Kokoro
Разработчик опубликовал на GitHub пошаговый репозиторий для построения полностью локального голосового агента без использования сторонних API. Пайплайн включает Whisper для распознавания речи, локальную LLM в формате GGUF и Kokoro для синтеза голоса с поддержкой потоковой передачи в реальном времени. Ресурс полезен для инженеров, желающих понять архитектуру и оптимизацию задержек в AI-системах.
score 24r/LocalLLaMA