Reddit
Бенчмарк EnterpriseRAG-Bench: тестирование RAG на реалистичных корпоративных данных
Исследователи представили EnterpriseRAG-Bench — датасет из 500 тысяч синтетических документов для оценки RAG-систем на реалистичных внутренних данных компании. В отличие от публичных источников, коллекция имитирует реальные корпоративные коммуникации: Slack, почту, тикеты и документацию. Это позволяет проверять эффективность RAG в условиях, близких к реальным бизнес-задачам.
score 36r/LocalLLaMA