Word Cloud меток избранных статей на Habrahabr и Geektimes
Python
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
favs
.gitignore
LICENSE
README.md
main.py
requirements.txt
scrapy.cfg
test.png

README.md

habr_favs

Установка

git clone https://github.com/stleon/habr_favs.git
cd habr_favs
pyvenv-3.5 venv
source venv/bin/activate
pip install -r requirements.txt

Запуск

Принцип работы очень простой:

Парсим метки у статей, которые пользователь добавил в избранное на Habrahabr и Geektimes

scrapy crawl favs -o tags.csv -s HABR_USER=lol

Где lol - логин пользователя. По-умолчанию, используется мой.

В файле tags.csv будут находится все метки этих статей.

Далее строим word_cloud:

python main.py

В итоге увидим файл test.png примерно такого содержания:

Mine word_cloud