Reddit
Ваш голосовой агент, вероятно, тормозит не из-за LLM.
Автор утверждает, что задержки в голосовых AI-агентах чаще связаны с этапами STT, TTS или сетевыми проблемами, а не с работой самой языковой модели. В материале разбирается архитектура конвейера обработки речи, предлагаются метрики для диагностики и сравниваются популярные инструменты вроде Deepgram, ElevenLabs и LiveKit. Акцент делается на стабильности работы в продакшене, а не только на скорости отклика в демо-режиме.
score 40r/AI_Agents