Назад к дайджесту
Новость

Pollux: LLM-судья для оценки русскоязычных моделей

Команда Sber AI открыла доступ к модели Pollux — специализированному LLM-судье для оценки качества русскоязычных языковых моделей. Инструмент реализует подход LLM-as-a-Judge, позволяя автоматизировать валидацию LLM перед внедрением в цифровые продукты.