Skip to content

Приложение для вебскрейпинга сайта ГИБДД c инструментом обхода капчи. Обладает функционалом парсинга полученных данных в форматы parquet, txt и xlsx. Использует многопоточность для оптимизации работы.

Notifications You must be signed in to change notification settings

Growb0y/GibddWebscraper.py

Repository files navigation

GIBDD_Webscraper

Приложение для вебскрейпинга сайта ГИБДД.

Использование

  1. Перейдите в папку с проектом
  2. Создайте в ней текстовый файл с винами.
    • Формат файла:
      • каждый вин на новой строке;
      • файл заканчивается пустой строкой.
  3. Запустите программу из командной строки с помощью команды вида:
python main.py vins_file required_types directory --dont_parse_site True
  • Аргументы:
    • vins_file - файл с винами;
    • required_types - типы, подлежащие проверке (history/dtp/all);
    • directory - папка с результатами;
    • --dont_parse_site - необязательный параметр, используемый при тестировании; если данные с сайта уже получены - установить в True.

About

Приложение для вебскрейпинга сайта ГИБДД c инструментом обхода капчи. Обладает функционалом парсинга полученных данных в форматы parquet, txt и xlsx. Использует многопоточность для оптимизации работы.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages