# Vizualizácia preferenčných hlasov vo voľbách do NRSR v roku 2016 v Pythone

V súčasnosti je k dispozíci stále viac dát, ktoré novinári, marketéri či analytici využívajú pri svojej práci. Kľúčom k  interpretácii je shopnosť vedieť ich spracovať, prípadane vizualizovať. Preto sme sa pozreli na to, ako vizualizovať preferenčné hlasy vybraných politikov vo voľbách v roku 2016 pomocou jazyka Python, knižnice Pandas a knižnice Folium. Zisťovali sme, či bývali župani, ktorí následne kandidovali do NRSR, mali výraznejšiu podporu vo svojom regióne.

## Komu pomôže vizualizácia dát?
Vizualizáciu dát môže využiť obrovské množstvo profesií. Zoberme si takého marketéra politickej strany - možno bude chcieť oslovovať voličov, u ktorých má vyššiu šancu na úspech na základe toho, aké strany voliči volili v minulosti. V poslednom období sa taktiež hovorí viac aj o [dátových novinároch](https://dennikn.sk/blog/462494/co-robi-datovy-novinar-otestovali-vizualizacie-dat/), medzi ktorých patril aj Ján Kuciak. Tí využívajú analýzu dát napríklad na nachádzanie podvodov či odhaľovaní prepojení osôb. Kým v zahraničí je dátová žurnalistika štandard, na Slovensku sa iba pomaly rozbieha. A zabúdať netreba ani na osobné využitia, napríklad pre rodičov, ktorí práve vyberajú školu svojmu dieťaťu a chceli by si okolité školy spolu s ich hodnotením zobraziť prehľadne na mape.


## Aké dáta budeme používať?
Pre našu analýzu budeme používať dáta z parlamentných volieb z roku 2016 od [Štatistického úradu Slovenskej republiky](http://volby.statistics.sk/). Dostupných dát našťastie postupne pribúda, či už na úrovni štátnych organizácií, ktoré ich zverejňujú na portáli [data.gov.sk](https://data.gov.sk/dataset), alebo aj na úrovni individuálnych samospráv ako [Bratislava](https://zive.aktuality.sk/clanok/143507/bratislava-zverejnila-zdrojove-kody-k-svojmu-portalu-otvorenych-dat-ma-aj-dalsie-novinky/) či [Prešov](https://sarisskyhackathon.sk/2019/10/zacal-sa-2-sarissky-hackathon-na-otvorenych-datach-mesta-presov-a-psk/). Pokročilejším spôsobom získavania dát môže byť aj naprogramovanie crawleru - robota, ktorý prehľadáva webové stránky a ukladá si relevantné informácie, napríklad ceny bytov z portálov s nehnuteľnosťami.


## Práca s dátami v Pythone
Programovací jazyk Python je populárny pre spracovávanie dát, a to najmä pre množstvo knižníc, ktoré uľahčujú ich spracovávanie. Zároveň je vhodný pre rôzne skúsených programátorov - využíva sa na učenie programovania ako takého, no zároveň ho používajú profesionálni dátoví vedci.

Kým väčšina programova napísaných v Pythone sa v jednom momente spustí a začne vykonávať, spracovávanie dát je špecifická záležitosť - chceme vidieť krok po kroku, ako ich upravujeme a čo sa v nich vôbec nachádza. Na to je ideálne prostredie Jupyter Notebook. Ukážku práce v ňom na konferencii [PyCon](https://www.pycon.sk/) predviedol Michal Kaukič.

```
Tu ide byť prísť YT video  
https://www.youtube.com/watch?v=rbIN9-zitPc
```

Pre samotné spracovanie dát použijeme knižnicu Pandas. Tá si uchováva dáta akoby v databázovej tabuľke a umožňuje štandartné operácie nad dátami bez toho, aby sme museli mať bežiacu reálnu databázu, čo nám zjednoduší celý postup. Zo stránky štatistického úradu sme údaje stiahli vo formáte CSV a jedným príkazom ich vieme nahrať do Pandas. V prostredí Jupyter Notebook nám Pandas prehľadne vypisuje všetky základné informácie datasete a tým pádom získame rýchly prehľad o volebných záznamoch.

![image.png](attachment:image.png)
<div align="center"><i>Ukážka výpisu prvých 40 riadkov v Jupyter Notebook pomocou Pandas</i></div>

Vizualizáciu údajov na mape Slovenska spravíme pomocou knižnice Folium. Tá používa bezplatné mapy od služby OpenStreetMaps a zobrazovanie bodov na mape je v nej relatívne jednoduchá záležitosť - pre každú obec na Slovensku udávame GPS koordináty a farbu značky podľa toho, koľko percent preferenčných hlasov v nej daný kandidát získal.

## Ukážky
Pre samotnú vizualizáciu sme si vybrai stranu Smer-SD, nakoľko bola v roku 2016 víťazom volieb a zároveň malo hneď niekoľko bývalých županov na svojej kandidátke. Konkrétne sa pozrieme na popularitu bývalého žilinského župana Juraja Blanára a bývalého košického župana Richarda Rašiho.

![image.png](attachment:image.png)
<div align="center"><i>Pomer preferenčných hlasov k celkovému počtu platných hlasov pre jednotlivé obce vo voľbách v roku 2016 pre Juraja Blanára (bývalý predseda ŽSK)</i></div>

![image.png](attachment:image.png)
<div align="center"><i>Pomer preferenčných hlasov k celkovému počtu platných hlasov vo voľbách v roku 2016 pre Richarda Rašiho (bývalý predseda Košického samosprávneho kraja)</i></div>

Z máp vidíme, že najväčšiu podporu mali bývalý župani práve vo svojich samosprávnych krajoch. Obdobné to je aj s ďalšími bývalými županmi. Naopak, prvé miesta kandidátky strany majú oveľa rovnomernejšie rozloženie preferenčných hlasov po Slovensku - ako príklad uvázdame toho času podpredsedu vlády Petra Pellegriniho.

![image.png](attachment:image.png)
<div align="center"><i>Pomer preferenčných hlasov k celkovému počtu platných hlasov vo voľbách v roku 2016 pre Petra Pellegriniho (ktorý pochádza z Banskej Bystrice)</i></div>

## Ďalšie kroky
Ukážky vyššie sú iba nahliadnutím do toho, ako v jazyku Pyhon dokážeme vizualizovať dáta. No čo ak neviem programovať a chcel by som sa to naučiť? Možností je, samozrejme, hneď viacero. Online portály ako [DataCamp]() alebo [LearnToCode]() ponúkajú relatívne lacné online kurzy na dátovú analýzu. Inšpiratívnym podujatím je aj konferencia [PyCon Slovakia](), kde sa každoročne stretáva komunita Pythonistov a v programe je vždy niekoľko dátových prednášoch a workshopov.

## Dátami proti dezinformáciam na školách
Spracovávanie a vizualizácia dát vie byť relatívne zaujímavou úlohou, najmä vďaka veľkému počtu dostupných typov datasetov - každý si môže vybrať tému, ktorá ho najviac zaujíma. Navyše, veľká časť stredných škôl už učí na informatike Python, alebo naň postupne prechádzajú. Preto občianske združenie [SPy]() začalo podporovať učiteľov informatiky tvorbou návodov na spracovávanie dát - priespieť vlastným návodom môže každý na stránke [python.sk/data]()

---
# Zdroje a podklady

Technické články (inšpirácia, aký štýl použiť)
- https://zive.aktuality.sk/clanok/118398/minipocitac-raspberry-pi-dostal-nove-graficke-prostredie-pixel/
- https://zive.aktuality.sk/clanok/143507/bratislava-zverejnila-zdrojove-kody-k-svojmu-portalu-otvorenych-dat-ma-aj-dalsie-novinky/
- https://dennikn.sk/blog/462494/co-robi-datovy-novinar-otestovali-vizualizacie-dat/