Новость
Использование LLM в качестве декодера для ASR: адаптация SOTA-архитектуры для спонтанной русскоязычной речи
Команда Контура адаптировала модель Canary-Qwen-2.5B с архитектурой SALM для распознавания спонтанной русской речи в телефонии и видеоконференциях. Статья описывает практический опыт внедрения гибридного подхода, сочетающего речевой энкодер и языковую модель, без использования десятков тысяч часов размеченных данных. Рассматриваются результаты тестирования на реальных данных и подходы к улучшению WER.