Skip to content

Mahammad45/LcWaikiki

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

Парсер продуктов LC-Waikiki

Этот проект представляет собой веб-скрейпер, разработанный для сбора данных с сайта LC-Waikiki. Он извлекает информацию, такую как URL продуктов, идентификаторы, названия и цены товаров, перечисленных на сайте, и сохраняет собранные данные в JSON файл.

Структура проекта

Основной скрипт проекта выполняет следующие задачи:

  1. Отправка HTTP-запросов: Использует библиотеку requests для отправки HTTP GET-запросов на сайт LC-Waikiki.
  2. Парсинг HTML: Использует BeautifulSoup из библиотеки bs4 и lxml для парсинга HTML-контента страниц.
  3. Извлечение данных: Обрабатывает распарсенный HTML для извлечения соответствующей информации о продуктах.
  4. Сохранение данных: Сохраняет собранные данные в JSON файл.

Требования

Для работы этого проекта требуются следующие библиотеки Python:

  • beautifulsoup4
  • lxml
  • requests

Вы можете установить необходимые библиотеки с помощью pip:

pip install bs4 lxml requests

Использование

Чтобы запустить веб-скрейпер, просто выполните основной скрипт. Скрипт будет перебирать несколько страниц сайта LC-Waikiki, извлекать данные о продуктах и сохранять их в файл под названием data.json.

Заметки

  • Убедитесь, что у вас есть активное подключение к интернету при запуске скрипта.
  • Этот скрипт предназначен для образовательных целей и личного использования. Учитывайте условия использования сайта при сборе данных.

Лицензия

Этот проект лицензирован по лицензии MIT. Смотрите файл LICENSE для получения подробной информации.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages