Новость
Pollux: LLM-судья для оценки русскоязычных моделей
Команда Sber AI открыла доступ к модели Pollux — специализированному LLM-судье для оценки качества русскоязычных языковых моделей. Инструмент реализует подход LLM-as-a-Judge, позволяя автоматизировать валидацию LLM перед внедрением в цифровые продукты.