Новость12 июня 2026 г.

PixelRAG превосходит текстовые парсеры по точности и сокращает затраты токенов ИИ-агентов в 10 раз

Исследователи из UC Berkeley, Princeton и Databricks представили систему PixelRAG, которая заменяет традиционный текстовый парсинг веб-страниц на обработку их скриншотов с помощью моделей компьютерного зрения. Новый подход позволяет повысить точность ответов на 18,1% и сократить затраты токенов ИИ-агентов в 10 раз, устраняя ошибки, неизбежные при конвертации HTML в текст. Это решение работает напрямую с рендерингом страниц, избавляя от необходимости специфической инженерной настройки для каждого сайта.

venturebeat.comhttps://venturebeat.com/data/pixelrag-beats-text-parsers-on-accuracy-and-cuts-ai-agent-token-costs-10x