Reddit
Голосовые агенты в зашумленной среде
Компания из сферы Speech AI представила модель для выделения голоса основного говорящего и подавления фонового шума. Решение обеспечивает снижение WER на 50% на ведущих ASR-моделях по сравнению с индустриальными бенчмарками. Автор делится деталями обучения и итераций модели для работы в сложных акустических условиях.
score 40r/AI_Agents