Reddit
Moss-Audio Captioning: первый в своём роде инструмент для анализа аудио | Репозиторий с GUI для пакетной обработки и YouTube
Открытая модель Moss-Audio выходит за рамки простой транскрибации, распознавая звуки, события и музыку, а также отвечая на вопросы по аудиозаписям. Инструмент поддерживает пакетную обработку, работу с YouTube и экспорт данных для обучения LoRA.
score 20r/StableDiffusion