GitHub
DocPull: Парсинг сайтов в AI-ready Markdown с поддержкой MCP
Асинхронный CLI-инструмент на Python для извлечения контента с веб-сайтов и конвертации его в чистый Markdown, оптимизированный для RAG-систем. Поддерживает профили краулинга, кэширование и протокол Model Context Protocol (MCP) для интеграции с ИИ-агентами.
222 forksPythonscore 60
markdownpythonragpypillmweb-scrapingdeveloper-toolscrawlerai-training-datamcp