Назад к дайджесту
Reddit

DharmaOCR: Открытый специализированный SLM (3B) и бенчмарк эффективности против LLM

Команда открыла специализированную модель DharmaOCR на 3 и 7 миллиардов параметров, дообученную методами SFT и DPO. Модель показала результаты выше, чем у GPT-5.4 и Gemini в задачах OCR, при этом квантование AWQ снизило стоимость инференса на 22%. Это значимый релиз для open-source сообщества, конкурирующий с Google Document AI.

score 20r/MachineLearning