V prvom kroku si nainštalujeme virtuálne prostredie, v ktorom budeme našu aplikáciu vyvíjať a spúštať. Virtuálne prostredie slúži k oddeleniu rôznych inštalácií balíčkov, verzií Pythonu na jednom počítači. Taktiež ak sa niečo v projekte pokazí, ktorý je vytvorený v rámci daného virtuálneho prostedia, neohrozí to ďalšie projekty na počítači.
Úlohy:
-
Otvor si príkazový riadok (terminál - Mac OS, Linux)
-
Zvoľ si adresár, v ktorom budeš mať vytvorený projekt a následne pracovať.
-
Naviguj sa do adresára
-
Vytvor novú složku a vstúp do novo-vytvorej zložky
-
Vytvor virtuálne prostredie. Príkazy pre vytvorenie virtuálneho prostredia sa líšia podľa operačného systému:
Windows:
> py 3 -m venv venv
Linux/Mac OS:
$ python3 -m venv venv
Po vytvorení virtuálneho prostredia je potrebné ho spustiť. . Spustenie virtuálneho prostredia sa taktiež líši podľa operačného systému:
Windows:
>\venv\Scripts\activate
Linux/Mac OS:
$ source /venv/bin/activate
Po spustení by malo ukázať pred >
alebo $
slovo (venv)
.
(venv) MacBook-Pro:pyconworkshop svetlanamargetova$
Na inštaláciu budeme využívať pip.
Anaconda - obsahuje všetky potrebné balíčky pre prácu. Tí, čo anacondu inštalovať nechcú, pokračujte pokynmi nižšie.
Jupyter notebook je webová aplikácia, ktorá umožňuje zdielať a vytvárať dokumenty obsahujúce "živý" kód, vizualizácie, markdown system, HTML kód a mnoho iného.
$ pip install jupyter
Pandas je knižnica umožňujúca prácu s dátovými štruktúrami rôznych formátov v Pythone.
$ pip install pandas
V rámci Pandas sa nám naištalovala aj potrebná knižnica numpy.
Matplotlib je knižnica vykresľujúca 2D vizualizácie v Pythone v rôznych formátoch. Umožňuje vykreslovať rôzne druhy grafov, ukladať výstupy v rôznych formátoch.
$ pip install matplotlib
Scipy je knižnica obsahujúca rôzne štatistické a iné funkcie.
$ pip install scipy
Po nainštalovaní potrebných knižníc si môžeme spustiť na localhoste Jupyter notebook pomocou príkazu:
$ jupyter notebook
Vytvor zložku "csv" v hlavnom adresári projektu. Následne stiahni dátové sety a ulož do složky "csv".
- Dátový set Instagramu
- Dátový set kníh
- Dátový set používatelia
Skript na sťiahnutie dát z rôznych Instagram účtov - InstagramToCsv
- Sťahovať vždy na začiatku práce aktuálne dáta z Instagramu
- Zautomatizovať spracovanie clusterov bez nutnosti zadávať hodnoty ručne používateľom
- Rozpoznávanie názvu kníh z obrázku, kde nie je hashtag (nice to have)
- Poslať výstup priamo cez API na server
- Zautomatizovať