Назад к дайджесту
Новость

Как я оценивал точность ИИ в распознавании еды: бенчмарк, LLM-as-judge и баг с варёной гречкой

Автор описывает процесс создания приложения для подсчёта калорий по фото и проводит строгий бенчмарк точности компьютерного зрения. В материале разбирается методика оценки через LLM-as-judge, проблемы с confidence score и скрытые ошибки в логике расчёта КБЖУ. Статья полезна для инженеров, занимающихся внедрением ML-моделей в продакшн.