Назад к дайджесту
Reddit

Не переусложняем ли мы RAG, если корень проблемы — в структуре данных?

Автор поднимает вопрос о том, что проблемы с качеством ответов LLM часто связаны не с настройкой поиска, а с исходным качеством данных. Вместо тонкой настройки чанков и эмбеддингов, эффективнее привести знания в чистый структурированный вид, например, в Markdown. Это позволяет получать предсказуемые результаты с меньшими усилиями.

score 17r/AI_Agents