Новость
Инженерия качества: Как перестать надеяться на удачу и начать измерять ИИ-агентов [Часть 2]
Статья продолжает серию о метриках оценки качества ИИ-систем, фокусируясь на универсальных показателях для LLM и суммаризации текста. На примере библиотеки RAGAS разбирается внутреннее устройство метрик для практического применения. Материал полезен инженерам, внедряющим и тестирующим языковые модели и агенты.