Новость13 июня 2026 г.

Как я оценивал точность ИИ в распознавании еды: бенчмарк, LLM-as-judge и баг с варёной гречкой

Автор описывает процесс создания приложения для подсчёта калорий по фото и проводит строгий бенчмарк точности компьютерного зрения. В материале разбирается методика оценки через LLM-as-judge, проблемы с confidence score и скрытые ошибки в логике расчёта КБЖУ. Статья полезна для инженеров, занимающихся внедрением ML-моделей в продакшн.

habr.comhttps://habr.com/ru/articles/1046914/?utm_campaign=1046914&utm_source=habrahabr&utm_medium=rss