Reddit
Честно говоря, именно чанкование — главная скрытая проблема большинства RAG-систем
Автор утверждает, что стандартное чанкование (разбивка текста) часто разрушает структуру документа, из-за чего система теряет важные метаданные и контекст. Вместо этого предлагается сохранять целостность документа или использовать семантические сводки, привязанные к метаданным. Такой подход повышает надёжность агентов в продакшене, снижая количество галлюцинаций и необходимость в дополнительных хитростях.
score 11r/AI_Agents