Парсер имеет 4 режима работы (аргументы командной строки можно посмотреть введя в терминале из дериктории src/
команду python main.py --help
):
- Собирает важные изменения между основными версиями Python
- Соберает ссылки на статьи о нововведениях
- Достаёт из статей справочную информацию (имя автора или редактора статьи)
- Сохраняет результат в табличном виде в csv-файл или выводит в терминал
- Собирает информацию о версиях Python
- Находит номера, статусы и ссылки на документацию
- Сохраняет результат в табличном виде в csv-файл или выводит в терминал
- Скачивает архив с документацией на актуальную версию Python
- Собирает данные обо всех документах PEP
- Сравнивает статус на странице PEP со статусом в общем списке
- Считает количество PEP в каждом статусе и общее количество PEP
- Сохраняет результат в табличном виде в csv-файл или выводит в терминал
Python, BeautifulSoup, PrettyTable, tqdm, logging
Клонировать репозиторий и перейти в него в командной строке:
git clone git@github.com:ase77/bs4_parser_pep.git
cd bs4_parser_pep/src
Cоздать и активировать виртуальное окружение:
-
Если у вас Linux/MacOS
python3 -m venv venv source venv/bin/activate
-
Если у вас Windows
python -m venv venv source venv/Scripts/activate
Установить зависимости из файла requirements.txt:
python3 -m pip install --upgrade pip
pip install -r requirements.txt
Запуск парсера:
Перейти в дерикторию cd bs4_parser_pep/src
Ввести в командной строке python main.py
+ обязательный позиционный аргумент и при необходимости, необязательный опциональный аргумент, например:
python main.py whats-new -o pretty
positional arguments:
{whats-new,latest-versions,download,pep}
Режимы работы парсера
optional arguments:
-h, --help show this help message and exit
-c, --clear-cache Очистка кеша
-o {pretty,file}, --output {pretty,file}
Дополнительные способы вывода данных
Моторин А.В.
В начало ☝️