Назад к дайджесту
Reddit

Xiaomi представила SOTA модель распознавания речи MiMo-V2.5-ASR

Команда Xiaomi MiMo выпустила продвинутую модель распознавания речи, поддерживающую диалекты, код-свитчинг, песни и работу в шумных условиях. Система достигает лучших результатов на публичных бенчмарках благодаря крупномасштабному обучению и алгоритмам подкрепления. Модель доступна на платформе Hugging Face для интеграции в приложения.

score 35r/LocalLLaMA