Новость
PixelRAG превосходит текстовые парсеры по точности и сокращает затраты токенов ИИ-агентов в 10 раз
Исследователи из UC Berkeley, Princeton и Databricks представили систему PixelRAG, которая заменяет традиционный текстовый парсинг веб-страниц на обработку их скриншотов с помощью моделей компьютерного зрения. Новый подход позволяет повысить точность ответов на 18,1% и сократить затраты токенов ИИ-агентов в 10 раз, устраняя ошибки, неизбежные при конвертации HTML в текст. Это решение работает напрямую с рендерингом страниц, избавляя от необходимости специфической инженерной настройки для каждого сайта.