Назад к дайджесту
Reddit

Бенчмарк EnterpriseRAG-Bench: тестирование RAG на реалистичных корпоративных данных

Исследователи представили EnterpriseRAG-Bench — датасет из 500 тысяч синтетических документов для оценки RAG-систем на реалистичных внутренних данных компании. В отличие от публичных источников, коллекция имитирует реальные корпоративные коммуникации: Slack, почту, тикеты и документацию. Это позволяет проверять эффективность RAG в условиях, близких к реальным бизнес-задачам.

score 36r/LocalLLaMA