Проект асинхронного парсинга документации PEP

Описание

Выполняется парсинг данных со страницы с общей информацией о PEP (https://peps.python.org/), переход по ссылкам и сбор данных о каждом PEP. Парсер подготавливает данные и сохраняет их в два файла формата csv в папку results.

Перед использованием

Клонируйте репозиторий к себе на компьютер:

git clone https://github.com/94R1K/scrapy_parser_pep.git

В корневой папке создайте виртуальное окружение и установите зависимости:

python -m venv venv

pip install -r requirements.txt

Запуск парсера из командной строки:

scrapy crawl pep

Вывод результатов

Результатом работы парсера будет создание двух файлов:

pep_ДатаВремя.csv - содержит список всех PEP (number, name, status);
status_summary_ДатаВремя.csv - содержит сводку по статусам PEP: сколько найдено документов в каждом статусе (Status, Quantity). В последней строке этого файла в колонке Total выводится общее количество всех документов.

Об авторе

Лошкарев Ярослав Эдуардович
Python-разработчик (Backend)
Россия, г. Москва
E-mail: real-man228@yandex.ru

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
pep_parse		pep_parse
results		results
tests		tests
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Проект асинхронного парсинга документации PEP

Описание

Перед использованием

В корневой папке создайте виртуальное окружение и установите зависимости:

Запуск парсера из командной строки:

Вывод результатов

Об авторе

About

Releases

Packages

Languages

94R1K/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

Проект асинхронного парсинга документации PEP

Описание

Перед использованием

В корневой папке создайте виртуальное окружение и установите зависимости:

Запуск парсера из командной строки:

Вывод результатов

Об авторе

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages