Этот репозиторий содержит готовый код парсера, который мы разбираем в лекциях.
Репозиторий состоит из трех веток:
main
- тут лежит оригинальная версия парсера, написанная @Euphefunctional
- версия парсера, написанная в функциональном стилеobject_oriented
- версия парсера, написанная в стиле ООП
- Получение списка топ-100 книг и авторов с сайтов:
- Сохранение результатов в файл
txt
- Веб-интерфейс
- Обработка динамических страниц
Объединившись вместе, мы можем написать крутой и красивый парсер, а также сделать его более универсальным.
Инструкция по принятию участия в проекте ТУТ .
Описываю для win, но особой разницы нет, да и уповаю на сообразительность линуксоидов =) Создадим окружение внутри проекта:
> cd %путь до папки с проектом%
> virtualenv env
env - название папки с виртуальным окружением, можете выбрать любое. Теперь в папке с нашим проектом запустим
> ../env/Scripts/activate
Эта строка на время даст возможность запускать pip или python из venv одноименными командами без указания абсолютного пути.
Далее установим requirements, если мы не в папке с requirements.txt
, то используем абсолютный путь до него:
> pip install -r requirements.txt #использован относительный путь
Теперь программу можно запустить с помощью > python %путь до программы%