Назад к дайджесту
GitHub

DocPull: Парсинг сайтов в AI-ready Markdown с поддержкой MCP

Асинхронный CLI-инструмент на Python для извлечения контента с веб-сайтов и конвертации его в чистый Markdown, оптимизированный для RAG-систем. Поддерживает профили краулинга, кэширование и протокол Model Context Protocol (MCP) для интеграции с ИИ-агентами.

222 forksPythonscore 60
markdownpythonragpypillmweb-scrapingdeveloper-toolscrawlerai-training-datamcp