Назад к дайджесту
Reddit

Какой стек технологий (STT/LLM/TTS) вы используете для голосовых агентов в реальном продакшене?

Автор обсуждает с сообществом реальные технологические стеки для голосовых ИИ-агентов в продакшене, включая STT, LLM и TTS решения. Поднимаются вопросы оптимизации задержек и выбора провайдеров вроде Deepgram, ElevenLabs и Vapi. Приведена схема логирования для анализа узких мест в пайплайне обработки голоса.

score 40r/AI_Agents