Reddit26 апреля 2026 г.

DharmaOCR: Открытый специализированный SLM (3B) и бенчмарк эффективности против LLM

Команда открыла специализированную модель DharmaOCR на 3 и 7 миллиардов параметров, дообученную методами SFT и DPO. Модель показала результаты выше, чем у GPT-5.4 и Gemini в задачах OCR, при этом квантование AWQ снизило стоимость инференса на 22%. Это значимый релиз для open-source сообщества, конкурирующий с Google Document AI.

score 20r/MachineLearning

reddit.comhttps://www.reddit.com/r/MachineLearning/comments/1sun6wt/dharmaocr_opensource_specialized_slm_3b/