Назад к дайджесту
Reddit

Голосовые агенты в зашумленной среде

Компания из сферы Speech AI представила модель для выделения голоса основного говорящего и подавления фонового шума. Решение обеспечивает снижение WER на 50% на ведущих ASR-моделях по сравнению с индустриальными бенчмарками. Автор делится деталями обучения и итераций модели для работы в сложных акустических условиях.

score 40r/AI_Agents