Reddit22 апреля 2026 г.

Почему нормализация текста в потоковом TTS так мало обсуждается?

Автор поднимает проблему ошибок потоковых TTS-моделей в нормализации текста: они корректно читают речь, но ошибаются в датах, URL и номерах. Приведён бенчмарк коммерческих решений, где качество синтеза оценивалось с помощью Gemini. Это критический вызов для продакшена, который часто остаётся в тени.

score 14r/MachineLearning

reddit.comhttps://www.reddit.com/r/MachineLearning/comments/1ssk7rk/i_cant_believe_text_normalization_is_so/