Reddit3 мая 2026 г.

Flare-TTS 28M: модель синтеза речи, обученная с нуля на одной видеокарте

Разработчик представил новую открытую модель синтеза речи Flare-TTS 28M, обученную полностью с нуля на датасете LJSpeech. Проект весит 28 миллионов параметров и был создан на одной видеокарте NVIDIA A6000 за 24 часа. Модель доступна бесплатно на Hugging Face, хотя качество голоса пока остаётся немного роботизированным.

score 83r/LocalLLaMA

reddit.comhttps://www.reddit.com/r/LocalLLaMA/comments/1t1mmnd/release_finally_my_first_tts_model_is_out/