## Programski jezik Python 
### i rad sa tabelarno predstavljenim podacima i biblioteka Pandas

Pre samog predavanja ovde možeš naučiti:
* Kako se učitava .csv fajl
* Kako prikazati tabelu
* Kako pročitati dimenziju tabele
* Kako prikazati početak tabele
* Kako prikazati kraj tabele
* Kako izdvojiti kolonu (cela, deo)
* Kako izdvojiti vrstu 
* Kako izdvojiti jednu ćeliju
* Šta je to iteracija?
* Sumiranje
* Kako da napišeš funkciju
* Šta je grananje
* Kako da filtriramo?
* Kako grupisati?
* Kako vizuelno predstaviti podatke.


### Učitavanje i prikaz

Kako u pozadini izgleda jedan .csv fajl?

Ne baš pregledno!

<img src = "csv.jpg">

Kako da od ovoga, dođemo do tabele koja je preglednija?

<img src = "tabela.png" class="mr-2 header-search-key-slash">

Programski jezik Python ima biblioteku Pandas koja će nam pomoći u radu sa podacima koji su tabelarno organizovani. 

In [None]:
import pandas as pd #učitavanje pandas biblioteke
skole = pd.read_csv("skole.csv") #učitavanje jednog .csv fajla
#skole  #ispis tabele

In [None]:
#dimenzija tabele
skole.shape

Iz ovoga vidimo da tabela ima 1423 vrste i 74 kolone.

Ponekad će ti zatrebati informacija u vezi sa samim podacima koji se nalaze u tabeli. Detaljnije o ovome biće reči na predavanju, sada pokreni narednu ćeliju i vidi šta je rezultat izvršavanja naredbe skole.info(). 

In [None]:
#skole.info()

## Zavirimo u podatke!

<img src = "podaci.png">

### Čemu ovo služi?

In [None]:
#Izdvajamo imena kolona
skole.columns

In [None]:
#Vrste
skole.index

Sada već znamo malo više, možemo da se krećemo kroz tabelu pomoću kolona i vrsta! Često ćeš biti u situaciji da saznaš nešto više o jednoj (ili nekoliko) koloni ili vrsti. Dobar način da krenemo u istraživanje podataka je da znamo da izdvojimo kolonu ili kolone, vrstu ili više vrsta.

### Izdvajanje kolone

In [None]:
#Izdvaja se kolona koja se zove "Okrug"
skole["Okrug"]

In [None]:
#Šta se dobija pozivanjem naredbe:
skole["Okrug"].size
#Da li smo se već sreli sa nečim sličnim?

Šta ako ne želim da ispišem sve kolone?

### Ispis prvih 10 elemenata kolone

In [None]:
skole["Okrug"].head(10)

### Ispis jednog elementa kolone

In [None]:
skole["Okrug"][0] #ispisuje se prvi element iz kolone

In [None]:
skole.columns

### Izdvajanje vrste

In [None]:
skole.loc[0] #izdvajamo 1. vrstu

In [None]:
skole.loc[9] #izdvajamo 10. vrstu

In [None]:
skole.loc[9][5] #još jedan način da pristupimo jednoj konkretnoj ćeliji.

Sečenje (slicing) ili kako izdvojiti više od jedne vrste i kolone - detaljnije na predavanju!

### Gde počinje Python?

<img src="logo.png">

Zamisli sledeću situaciju. Imaš određenu sumu novca u evrima (novac_evr1 = 120) i želiš da znaš koliko ta suma iznosi u dinarima. 
Prvo što te zanima je koliki je kurs evra u tom trenutku. 


Neka je kurs = 117.2567. Kolika je ova suma novca u dinarima izračunaćeš kada novac_evr pomnožimo sa kursom.


Vrednost novca u dinarima je:
    
    novac_evr * kurs

In [None]:
Zamislimo dalje situaciju, u toku dana bi trebalo još neke novčane sume u evrima da preračunaš u dinare. Kako?

In [None]:
kurs = 117.2567
novac_evr1 = 120
novac_din1 = novac_evr1 * kurs

Računamo sledeću sumu:

In [None]:
novac_evr2 = 420
novac_din2 = novac_evr2 * kurs

In [None]:
novac_evr3 = 600
novac_din3 = novac_evr3 * kurs

...

In [None]:
novac_evr6 = 200
novac_din6 = novac_evr6 * kurs

### Petlja for i šta sa njom?

Koncept petlje je fundamentalan u programiranju, detaljnije će biti reči tokom predavanja. Sada samo kratka demonstracija 
primene na prethodni zadatak.

In [None]:
kurs = 117.2567
# menjaj vrednost cena_eur pa variraj
cena_eur = 350
cena_eur * kurs

In [None]:
for cena_eur in [120, 420, 600, 150, 300, 200]:
    print(cena_eur, cena_eur * kurs)

Standardan oblik petlje for možeš videti u narednom primeru. Pokreni narednu ćeliju.

In [None]:
for i in range(10):
    print("Zdravo, svete!")

Napiši skript koji ispisuje cifre od 0 do 9.

In [None]:
#skole["Broj ucenika - prvi razred"][0]
#skole["Broj ucenika - prvi razred"][1]
#skole["Broj ucenika - prvi razred"][2]
#....
#skole["Broj ucenika - prvi razred"][9]
for i in skole.index[:100]:
    print(skole.loc[i,"Broj ucenika - prvi razred"])

In [None]:
skole["Okrug"].tail(10) #ispis poslednjih 10 elemenata kolone "Okrug"

Ovo možemo ispisati i pomoću petlje.

In [None]:
for i in range(skole["Okrug"].count()-10, skole["Okrug"].count()):
     print(skole["Okrug"][i])

In [None]:
#još jedan način da prođemo kroz elemente vrste
for i in skole.columns:
    print(skole.loc[9][i])

### Možemo li bez petlje?

In [None]:
Biblioteka pandas nudi različite mogućnosti. 

In [None]:
Napisati skript koji u tabeli skole umeće novu kolonu "Broj ucenika 1-4" u kojoj se nalazi 
ukupan broj učenika od 1. do 4. razreda za svaku školu.  

In [None]:
Skript možemo napisati pomoću petlje for:

In [None]:
skole.columns

In [None]:
%%timeit
skole["Broj ucenika 1-4"] = 0
for i in range(len(skole)):
    skole.loc[i, "Broj ucenika 1-4"] = skole["Broj ucenika - prvi razred"][i] + skole["Broj ucenika - drugi razred"][i] + skole["Broj ucenika - treći razred"][i] + skole["Broj ucenika - cetvrti razred"][i]
skole.head()

In [None]:
%%timeit
skole["Broj ucenika 1-4"] = skole["Broj ucenika - prvi razred"] + skole["Broj ucenika - drugi razred"] + skole["Broj ucenika - treći razred"] + skole["Broj ucenika - cetvrti razred"]
skole.head()


In [None]:
#skole.columns
t = skole[skole["Okrug"] == "Град Београд"]

### Sumiranje

In [None]:
skole.sum()

In [None]:
tabela = pd.read_csv("podaci.csv")
tabela["Broj devojčica"].sum()

In [None]:
s = 0
for broj in tabela["Broj devojčica"]:
    s = s + broj
print(s)

In [None]:
tabela["Broj devojčica"].max()

In [None]:
#tabela[tabela["Broj devojčica"]==tabela["Broj devojčica"].max()]["Okrug"]

In [None]:
tabela["Broj učenika"].mean()

Koliki je prosečan broj učenika u odeljenju prvog razreda?

In [None]:
#skole.columns
broj_ucenika = skole["Broj ucenika - prvi razred"].sum() #ukupan broj učenika prvog razreda
broj_ucenika

In [None]:
broj_odeljenja = skole["Broj odeljenja - prvi razred"].sum()
broj_odeljenja

In [None]:
po_odeljenju = round(broj_ucenika / broj_odeljenja) #round() funkcija kojom zaokružujemo broj
po_odeljenju

Koliki je prosečan broj učenika u odeljenju osmog razreda?

In [None]:
broj_ucenika_8 = skole["Broj ucenika - osmi razred"].sum() #ukupan broj učenika prvog razreda
broj_ucenika_8

In [None]:
broj_odeljenja_8 = skole["Broj odeljenja - osmi razred"].sum()
broj_odeljenja_8

In [None]:
po_odeljenju_8 = round(broj_ucenika_8 / broj_odeljenja_8) #round() funkcija kojom zaokružujemo broj
po_odeljenju_8

Šta ukoliko želimo da izračunamo za svaki razred prosečan broj učenika?

### Kako definisati funkciju?

Ukoliko želimo da izračunamo broj učenika po odeljenju za sve razrede 
(osnovna i srednja škola), morali bi da kopiramo veliki broj puta, što nije rešenje! 

In [None]:
def prosek (ucenici, odeljenja):
    return round(ucenici.sum()/odeljenja.sum())

In [None]:
x = prosek(skole["Broj ucenika - osmi razred"],skole["Broj odeljenja - osmi razred"])
print(x)

Napisati funkciju kojom se izračunava procenat učenika koji radi po IOP3 programu u okviru jednog 
razreda na nivou svih okruga.

In [None]:
def ime():
    .....

### Filtriranje

In [None]:
tabela[tabela["Broj devojčica"] > 10000]["Okrug"]

In [None]:
for i in range(tabela["Broj devojčica"].count()):
    if tabela["Broj devojčica"][i] > 10000:
        print(tabela["Okrug"][i])
        

In [None]:
len(tabela[tabela["Broj odeljenja"] < 50])

In [None]:
devojcice_5000 = tabela[tabela["Broj devojčica"] > 5000]
devojcice_5000["Broj učenika"].sum()

In [None]:
tabela[tabela["Broj devojčica"] > 5000]["Broj učenika"].sum()

### Grupisanje

In [None]:
skole

In [None]:
skole.groupby("Округ")["Број девојчица - први разред"].sum()

In [None]:
t = skole.groupby("Okrug")[["Broj ucenika - prvi razred", "Broj ucenika - drugi razred"]].sum()

In [None]:
t

In [None]:
t.loc["Јужнобанатски управни округ","Broj ucenika - prvi razred"]

In [None]:
t.iloc[1,0]

In [None]:
t.loc["Јужнобанатски управни округ":"Златиборски управни округ"]

In [None]:
t.loc[:,"Broj ucenika - prvi razred":"Broj ucenika - drugi razred"]

In [None]:
skole.iloc[::100,:10]

In [None]:
tabela.sort_values("Broj odeljenja", ascending=False).head()

In [None]:
skole.groupby("Okrug")["Broj devojcica - prvi razred"].sum().sort_values(ascending = False).head(10)


### Vizuelno predstavljanje podataka

Biblioteka matplotlib.pyplot.

In [None]:
import matplotlib.pyplot as plt
t = skole.groupby("Okrug")["Број девојчица - први разред"].sum().sort_values(ascending = False).head(10)
for i in range(1,4+1):
    plt.subplot(4, 1, i)
    plt.barh(t.index, t)

plt.show()