Умный парсер заголовков веб-страниц с кэшированием результатов в базе данных.
- 📊 Парсинг заголовков h1-h3 с любых веб-страниц
- 💾 Интеллектуальное кэширование - повторные запросы выполняются мгновенно
- 🎯 Простой API - один endpoint для всех операций
- ⚡ Быстрая работа благодаря SQLite и эффективному парсингу
- Backend: FastAPI, Python, BeautifulSoup4
- Frontend: Svelte, JavaScript
- База данных: SQLite с реляционной структурой
- Парсинг: HTML-парсинг с обработкой ошибок
Парсит заголовки с указанного URL
Параметры:
- url(string) - URL для парсинга
Пример запроса: http GET http://localhost:8000/parse?url=https://example.com Ответ:
{ "url": "https://example.com", "titles": ["Example Domain", "This domain is for use..."], "source": "parsed (live)" }
Установка и запуск
git clone https://github.com/PinlishCafe2007/web-parser.git cd web-parser
pip install -r requirements.txt
python main.py
cd frontend npm install npm run dev
Запустите бэкенд и фронтенд
Откройте http://localhost:5173
Введите URL в поле ввода
Нажмите "Парсить" для получения заголовков
MIT License