Reddit
Xiaomi представила SOTA модель распознавания речи MiMo-V2.5-ASR
Команда Xiaomi MiMo выпустила продвинутую модель распознавания речи, поддерживающую диалекты, код-свитчинг, песни и работу в шумных условиях. Система достигает лучших результатов на публичных бенчмарках благодаря крупномасштабному обучению и алгоритмам подкрепления. Модель доступна на платформе Hugging Face для интеграции в приложения.
score 35r/LocalLLaMA