Назад к дайджесту
Новость

Использование LLM в качестве декодера для ASR: адаптация SOTA-архитектуры для спонтанной русскоязычной речи

Команда Контура адаптировала модель Canary-Qwen-2.5B с архитектурой SALM для распознавания спонтанной русской речи в телефонии и видеоконференциях. Статья описывает практический опыт внедрения гибридного подхода, сочетающего речевой энкодер и языковую модель, без использования десятков тысяч часов размеченных данных. Рассматриваются результаты тестирования на реальных данных и подходы к улучшению WER.