Reddit17 июня 2026 г.

Голосовые агенты в зашумленной среде

Компания из сферы Speech AI представила модель для выделения голоса основного говорящего и подавления фонового шума. Решение обеспечивает снижение WER на 50% на ведущих ASR-моделях по сравнению с индустриальными бенчмарками. Автор делится деталями обучения и итераций модели для работы в сложных акустических условиях.

score 40r/AI_Agents

reddit.comhttps://www.reddit.com/r/AI_Agents/comments/1u7s6zg/voice_agents_in_noisy_environments/