# Numpy

Numpy je biblioteka za "scientific computing" u Python-u. Raspolaže sa alatima za kreiranje i rukovanje multi-dimenzionim matricama. Postoje sličnosti sa Matlab-om. Pre korišćena neophodno je izvršiti import numpy biblioteke unutar skripte/python fajla.

In [None]:
import numpy as np

Uz pomoć numpy definišemo više-dimenzione nizove tj. tenzore (eng. tensors). Broj dimenzija predstavlja rang (eng. rank) od niza, i oblike (eng. shape) je veličina niza po svim dimenzijama tj. osama (eng. axis). Tenzori služe za reprezentacija podataka unutar neuronskih mreža i ti podaci su uglavnom brojevi.
Postoje:
- skalari (0D tenzor) - broj
- Vektorti (1D tenzor) - niz 
- Matrice (2D tenzor)
- 3D i više-dimenzioni tenzori uz pomoć kojih predstavljamo kompleksne podatke kao što su slike, video, zvuk, itd. 

Nizovi sadrže isti tip vrednosti elemenata i elementi su indeksirani kao skup nenagativnih brojeva od 0.

## Vektori (eng. Arrays)

Numpy vektor ili 1D tenzor, je niz sa jednom osom (rang 1). 
Postoji mnogo funkcija za rad sa numpy nizovima definisanih u numpy biblioteci.

In [None]:
# kreiranje niza ranga 1 
a = np.array([1, 2, 3])
print(a)

# oblik, broj elemenata po x-osi
print(a.shape)

# pristupanju elementu po indeksu/poziciji 
print(a[2])

## Matrice (eng. Matrics)

Matrica ili 2D tenzor, je niz sa dve ose (rang 2).

In [None]:
# dvodimenzioni niz - matrica 

m = np.array([[1, 2, 3], [4, 5, 6]])
print(f"Dvodimenzioni niz-matrica:\nm={m}\n") 

red, kolona = m.shape
print(f"Broj redova: {red} \nBroj kolona: {kolona}\n")

# element u 0 redu i 1 koloni
print(f"Element m[0, 1] = {m[0, 1]}\n")

# kreiranje matrice od nula na osnovu zadatog broja redova i kolona
a = np.zeros((2, 2))
print(f"Matrica sa nulama:\n {a}\n")

# kreiranje matrice od jedinica na osnovu zadatog broja redova i kolona
b = np.ones((3, 2))
print(f"Matrica sa jedinicama:\n {b}\n")

# kreira matrricu sa jedinicama na dijagonali, a ostali elementi su 0. Ne mora biti kvadratna matrica.
print(f"np.eye(2,3):\n {np.eye(2, 3)}\n")
# kreira kvadratnu matrrica sa jedinicama na dijagonali, a ostali elementi su 0
print(f"np.identity(2):\n {np.identity(2)}\n")

c = np.full((2, 2), 7)
print(f"Kreiranje niza sa zadatom konstatom:\n {c}\n")

d = np.random.random((2, 2))
print(f"Matrica sa random vrednostima:\n {d}")

In [None]:
# Rezultat je vektor sa prvim i poslednjim elementom zadatim sa prvim i drugim parametrom i ukupnim brojem elemenata
# predstavljen trećim parametrom
print(np.linspace(-5, 5, 10))

In [None]:
#dijagonala
print(np.diag([1,2,3,4,5]),'\n')

#transponovanje
m = np.array([[1,2],[3,4]])
print(m.T)

## Indeksiranje nizova

Postoji nekoliko načina za indeksiranje nizova. 

Spomenućemo sledeća:
- Slicing
- Integer indeksiranje
- Boolean indeksiranje

**Slicing** - numpy nizovi su više-dimenzioni nizovi te mora da se zada slice za svaku dimenziju.

In [None]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print(f"Matrica \na={a}\nranga 2\noblika:{np.shape(a)}\n")

# Izdvojiće se podmatrica od matrice a, gde se uzimaju prva dva reda, i 1 i 2 kolona matrice a
b = a[:2, 1:3]
print(f"Matrica b = [:2, 1:3]\nb={b}")

Slice nekog niza predstavlja samo pogled na originalni niz, svaka modifikacija direktno utiče na originalni niz

In [None]:
print(f"Stara vrednost elementa a[0, 1]={a[0, 1]}\n")   
b[0, 0] = 77    
print(f"Nakon izmene b[0, 0] = 77\nnova vrednost je a[0, 1]={a[0, 1]}")   

**Integer indeksiranje**

In [None]:
a = np.array([[1, 2], [3, 4], [5, 6]])
print(f"a =\n {a}\n")

m = a[[0, 1, 2], [0, 1, 0]]
print (f"a[[0, 1, 2], [0, 1, 0]] = {m}\nima oblike {np.shape(m)}\n")

# Ekvivalentno prethnom primeru
m = np.array([a[0, 0], a[1, 1], a[2, 0]])
print (f"np.array([a[0, 0], a[1, 1], a[2, 0]]) = {m}\n")

print(f"a[[0, 0], [1, 1]] = {a[[0, 0], [1, 1]]}") 
# Ekvivalentno prethnom primeru
print(f"np.array([a[0, 1], a[0, 1]]) = {np.array([a[0, 1], a[0, 1]])}\n") 

Selekcija ili izmena jednog elementa iz svakog reda.

In [None]:
a = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])

print(f"a =\n{a}\n")  

# niz indeksa
b = np.array([0, 2, 0, 1])

# Selektuje se jedan element iz svakog reda iz matrice a koristeći pozicije u vektoru b
print(a[np.arange(4), b],"\n")  

# Izmeni se jedan element iz svakog reda iz matrice a koristeći pozicije u vektoru b
a[np.arange(4), b] += 10
print(a,"\n")  

Postoji mogućnost kombinovanja integer i slice indeksiranja, ali ovo nije isto kao u MATLAB-u.

In [None]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])

print("Indeksiranje po redovima.")
red_r1 = a[1, :]    # Rang 1 pogled od drugog reda matrice a 
red_r2 = a[1:2, :]  # Rang 2 pogled od drugog reda matrice a 
red_r3 = a[[1], :]  # Rang 2 pogled od drugog reda matrice a
print (red_r1, red_r1.shape) 
print (red_r2, red_r2.shape)
print (red_r3, red_r3.shape)

print("\nIndeksiranje po kolonama.")
kol_r1 = a[:, 1]
kol_r2 = a[:, 1:2]
print (kol_r1, kol_r1.shape)
print ()
print (kol_r2, kol_r2.shape)

**Boolean indeksiranje** - primena kod selekcije elemenata koji ispunjavaju zadati uslov

In [None]:
a = np.array([[1, 2], [3, 4], [5, 6]])
print(a, "\n")

print("Vratiti sve elemente koji su veći od 2.\n")
bool_idx = (a>2)
print(bool_idx, "\n")

print(a[bool_idx], "\n")
# ili 
print(a[a > 2], "\n")

Za detaljniji pregled numpy indeksiranje niza pročitajte [dokumentaciju](https://numpy.org/doc/stable/reference/arrays.indexing.html).

## Tipovi podataka 

Numpy nizovi sadrže elemente istog tipa. Numpy nudi veliki skup numeričkih tipova podataka uz pomoć kojih se definišu nizovi. Ako se eksplicitno ne navede tip podatka, numpy pokušava da pogodi koji je tip u pitanju. Praksa je da se navede tip elemenata prilikom definisanja niza.

In [None]:
x = np.array([1, 2])  # Numpy odabira tip podatka
y = np.array([1.0, 2.0])  # Numpy odabira tip podatka
z = np.array([1, 2], dtype=np.int64)  # Eksplicitno je naveden tip podatka

print (x.dtype, y.dtype, z.dtype)

Više o tipovima podatka u Numpy biblioteci može se pronaći na [linku](https://numpy.org/doc/stable/reference/arrays.dtypes.html).

## Matematičke operacije

Osnovne matematičke operacije se primenjuju na svaki element u nizu. Operacije su dostupne kao preklopljeni operator i kao funkcija.


In [None]:
x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)

print("Sabiranje elemenata matrice")
print(f"x + y =\n{x + y}\n")
print(f"np.add(x, y)\n{np.add(x, y)}\n")

print("Oduzimanje elemenata matrice")
print(f"x - y =\n{x - y}\n")
print(f"np.subtract(x, y)\n{np.subtract(x, y)}\n")

print("Množenje")
print(f"x * y =\n{x * y}\n")
print(f"np.multiply(x, y)\n{np.multiply(x, y)}\n")

print("Deljenje")
print(f"x / y =\n{x / y}\n")
print(f"np.divide(x, y)\n{np.divide(x, y)}\n")

print("Kvadriranje")
print(f"np.sqrt(x)\n{np.sqrt(x)}")

Za razliku od MATLAB-a, ``*`` je operator koji množi svaki element matrice i ne predstavlja matrično množenje. Za matrično množenje potrebno je da se pozove ``dot`` funkcija iz Numpy. Ova funkcija može da se pozove kao funkcija niza ili kao zasebna funckija.

In [None]:
x = np.array([[1, 2], [3, 4]])
y = np.array([[5, 6], [7, 8]])

v = np.array([9, 10])
w = np.array([11, 12])

print("Matrićno množenje")
print("Množenje vektora, rezultat je skalarna vrednost.\n")
print (f"v.dot(w) = {v.dot(w)}")
print (f"np.dot(v, w) = {np.dot(v, w)}\n")

print("Množenje matrice i vektora, rezultat je vektor (rang 1 niz).\n")
print (f"x.dot(v) = {x.dot(v)}\n")
print (f"np.dot(x, v) = {np.dot(x, v)}\n")

print("Množenje matrica, rezultat je matrica (rang 2 niz).\n")
print (f"x.dot(y) =\n{x.dot(y)}\n")
print (f"np.dot(x, y) =\n{np.dot(x, y)}")

Pored standardnih matematičkih operacija ``Numpy`` nudi funkcije koje se izvršavaju nad nizovima. Na primer ``sum``.

In [None]:
x = np.array([[1, 2], [3, 4]])
print(f"x=\n{x}\n")
print(f"Suma svih elemenata np.sum(x)\n{np.sum(x)}\n") 
print(f"Suma elemanata po kolonama np.sum(x, axis=0)\n{np.sum(x, axis=0)}\n")  
print(f"Suma elemanata po redovima np.sum(x, axis=1)\n{np.sum(x, axis=1)}") 

Detaljnije o matematičkim operacijama nalazi se u [dokumentaciji](https://numpy.org/doc/stable/reference/routines.math.html).

Pored česte primene matematičkih operacija nad nizovima, neophodno ih je preoblikovati ili manipulisati sa podacima unutar nizova. Najjednostavniji primer ovog tipa operacije je transponovanje matrice. Matrica se transponuje pozivom atributa ``T`` nad objektom niza.

In [None]:
x = np.array([[1, 2], [3, 4]])

print(f"x=\n{x}\n")              
print(f"Transponovana matrica x.T=\n{x.T}\n")  

print("Vektor se ne transponuje")
v = np.array([1,2,3])
print(v)    
print(v.T) 

Detaljnije o funkcijama za manipulaciju nizovima nalazi se na sledećem [linku](https://numpy.org/doc/stable/reference/routines.array-manipulation.html).

### 1. Zadatak

Kreirati 4x4 matricu sa nasumičnim vrednostima i pronaći zbir svakog reda.

### 2. Zadatak

Kreirati 5x5 matricu sa nasumičnim vrednostima i sortirati svaku kolonu rastuće.

### 3. Zadatak

Kreirati 5x5 matricu sa nasumičnim vrednostima i zameniti minimalnu vrednost sa 0.

# Matplotlib 

Matplotlib je biblioteka za crtanje grafova. Da bismo koristili biblioteku mora da se import-uje iz `matplotlib.pyplot` modula.

In [None]:
import matplotlib.pyplot as plt

Da bi se slika prikazala u jupyter notebook-u koristimo komandu: 

In [None]:
%matplotlib inline

# Crtanje grafa

Funkcija koja će se najviše koristiti je ``plot``. Ova funkcija dozvoljava crtanje 2D podataka (x, y koordinate). 

Sledeći primer je crtanja rezultata grafa ``ReLU`` aktivacione funkcije.

In [None]:
x = np.linspace(-10, 10)
y = np.maximum(0, x)
#y = [max(0, val) for val in x]
plt.plot(x, y)
plt.show()

Naredni primer prikazuje kombinaciju rezultujućih grafova ``ReLU`` i ``Leaky ReLU`` aktivacionih funckija.

In [None]:
x = np.linspace(-50, 50)

y_relu = np.maximum(0, x)
y_leaky_relu = np.where(x > 0, x, 0.01 * x)

plt.plot(x, y_relu)
plt.plot(x, y_leaky_relu)

plt.xlabel('x axis label')
plt.ylabel('y axis label')
plt.title('Activation Functions')
plt.legend(['ReLU', 'Leaky ReLU'])

plt.show()

Naredni primer prikazuje kombinaciju rezultujućih grafova ``ReLU`` i ``Sigmoid`` aktivacionih funckija.

In [None]:
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

x = np.linspace(-5, 5)

y_relu = np.maximum(0, x)
y_sigmoid = [sigmoid(value) for value in x]

plt.subplot(2, 2, 1)
plt.plot(x, y_relu)
plt.title('ReLU')
plt.grid(True)

plt.subplot(2, 2, 2)
plt.plot(x, y_sigmoid)
plt.title('Sigmoid')
plt.grid(True)

plt.show()

Detaljnije možete pročitati dokumentaciju biblioteka na sledećem [linku](https://matplotlib.org/2.0.2/api/pyplot_api.html).

### 4. Zadatak

Implementirati sledeće aktivacione funckcije:
1. Linearna $$f(x) = x$$
3. Tanh $$ f(x) = tanh(x) = \frac{e^{x}-e^{-x}}{e^{x}+e^{-x}} $$

Kombinovati prethodne ReLU, Leaky ReLU, Sigmoid sa 1. i 2. na jednom grafu. Koristiti ``subplot``.

# Konvolucije

Konvolucija je fundamentalna operacija u obradi slika koja se koristi za izdvajanje značajnih osobine (eng. *features*) iz slike.
Matrica poznata kao **kernel** ili **filter** provlači se preko slike, i u zavisnosti od vrednosti u toj matrici, mogu se detektovati različite karakteristike kao što su horizontalne i vertikalne ivice, uglovi i drugi detalji.

Matematička formula za dvodimenzionalnu konvoluciju je:

$$ (I*H)(u,v) = \sum_{i=-N}^{N} \sum_{j=-N}^{N} I(u-i,v-j) \cdot H(i,j) $$

gde su:
* $I(u,v)$ vrednosti piksela ulazne slike na koordinatama $(u,v)$,
* $H(i,j)$ elementi kernela dimenyija $(2N + 1) \times (2N +1)$,
* $(i,j)$ kooridinate unutar kernela 
* $N$ je pola veličine kernela (ukoliko je kernel veličine $(2N + 1) \times (2N +1)$
* $(I*H)(u,v)$ je rezultat konvolucije na poziciji $(u,v)$

Primena konvolucije omogućava detekciju ivica na slici korišćenjem specifičnih kernela, kao što su Sobelovi (eng. *Sobel*) ili Previtovi (eng. *Prewitt*) filteri.

Previtovi filteri su jednostavni operatori za detekciju ivica koji koriste horizontalne i vertikalne matrice da izračunaju aprokismaciju gradijenta intenziteta slike.

* Horizontalni Previtovi kernel:
$$ H_x = \begin{bmatrix} 1 & 1 & 1 \\\ 0 & 0 & 0 \\\ -1 & -1 & -1 \end{bmatrix} $$

* Verikalne Previtovi 
$$ H_x = \begin{bmatrix} 1 & 0 & -1 \\\ 1 & 0 & -1 \\\ 1 & 0 & -1 \end{bmatrix} $$

Sobelovi filteri su slični Previtovim, ali daju veću težinu centralnim pikselima, što omogućava bolju detekciju ivica u prisustvu šuma.

* Horizontalni Sobelov kernel:
$$ S_x = \begin{bmatrix} 1 & 2 & 1 \\\ 0 & 0 & 0 \\\ -1 & -2 & -1 \end{bmatrix} $$

* Vertikalni Sobelov kernel:
$$ S_z = \begin{bmatrix} 1 & 0 & -1 \\\ 2 & 0 & -2 \\\ 1 & 0 & -1 \end{bmatrix} $$

**Napomena**\
Inverzija kernela je ključna za ispravnu implementaciju konvolucije. Matematička definicija konvolucije podrazumeva inverziju funkcije $H$ pre množenja sa funkcijom $I$. U diskretnom slučaju, to znači da kernel treba da bude rotiran za 180 stepeni (reflektovan po horizontalnoj i vertikalnoj osi). Ovo osigurava da se odnos između piksela u slici i odgovarajućih težinskih faktora u kernelu pravilno mapira tokom konvolucije. \
Nakon što se obrne kernel, gornji levi element $H(-N,-N)$ u formuli odgovara donjem desnom elementu.

Bez padding-a, veličina izlazne slike nakon konvolucije bila bi manja od ulazne, jer kernel "ne može" da se pozicionira na piksele blizu ivice bez "ispadanja" van granica slike. Dodavanjem padding-a (najčešće sa nulama), omogućavamo kernelu da se primeni na svim pikselima ulazne slike, uključujući i one na ivicama. Ovo rezultira izlaznom slikom iste veličine kao i ulazna, što je često poželjno u obradi slika. 

Koristiti sledeći kod za dodavanje ivice oko slike (ili implementirati sopstveno rešenje)

```python
pad_height = kernel_height // 2
pad_width = kernel_width // 2
padded_image = np.pad(image, ((pad_height, pad_height), (pad_width, pad_width)))
```


### 5. Zadatak
Implementirati prethodnu matematičku formulu za konvoluciju tako da se pronađu horizontalne i vertikalne ivice na slici. \
Za proveru koristiti sliku predstavljenu sledećom matricom. 
```python
image = np.array([
    [100, 100, 100, 100, 100, 100, 100],
    [100, 150, 150, 150, 150, 150, 100],
    [100, 150, 200, 200, 200, 150, 100],
    [100, 150, 200, 250, 200, 150, 100],
    [100, 150, 200, 200, 200, 150, 100],
    [100, 150, 150, 150, 150, 150, 100],
    [100, 100, 100, 100, 100, 100, 100]
])
```
Rezultat:\
<img src="images/image1.png" width="400">

# Učitavanje, prikaz i obrada tabelarnih podataka

Tabelarni podaci su jedan od najčešćih formata za skladištenje i razmenu podataka. Ovi podaci se često čuvaju u formatima kao što su CVS (eng. *Comma-Separated Values*) ekstenzija (.csv), Excel fajlovi (.xlsx), TSV (eng. *Tab-Separated Values*) i drugi. \
U programskom jeziku Python, jedan od najpopularnih biblioteka za rad sa tabelarnim podacima je `pandas`.
Pre korišćena neophodno je izvršiti import pandas biblioteke unutar skripte/python fajla.

In [None]:
import pandas as pd

### Učitavanje podataka
`Pandas` pruža jednostavne i efikasne metode za učitavanje različitih formata tabelarnih podataka:
* CSV fajlovi\
  `pd.read_csv('putanja_do/fajla.csv')`
* Excel fajlovi\
  `pd.read_excel('putanja_do/fajla.xlsx')`
* TSV fajlovi\
  `pd.read_csv('putanja_do/fajla.tsv', sep='\t')`

Nakon učitavanja, podaci se smeštaju u `DataFrame`, osnovnu strukturu podataka u biblioteci `pandas`, koja omogućava lako rukovanje i analize podataka. 

### Podaci u `DataFrame` strukturi se mogu istražiti sa sledećim metodama:
* `df.head(n)` - prikazuje prvih *n* redova
* `df.tail(n)` - prikazuje poslednjih *n* redova
* `df.info()` - daje informaciju o tipu podataka u svakoj koloni i o vrednostima koje nedostaju
* `df.describe()` - prikazuje osnovne statističke mere (srednja vrednost, standardna devijacija, minimum, maksimum, itd.) za numeričke kolone

In [None]:
df = pd.read_csv('data/studenti.csv')

broj_redova = 1

df.head(broj_redova)

In [None]:
df.tail(broj_redova)

In [None]:
df.info()

In [None]:
df.describe()

### Podaci u `DataFrame` strukturi se mogu selektovati: 
* `df['kolona']` - selektuje jednu kolonu
* `df[['kolona1', 'kolona2']]` - selektuje više kolona
* `df.loc[redovim kolone]` - selektuje podatke po imenima redova i kolona
* `df.iloc[redovim kolone]` - selektuje podatke po indeksima redova i kolona

In [None]:
df['ime']

In [None]:
df[['ime', 'godina_studija']]

In [None]:
df.loc[0, 'ime']

In [None]:
df.iloc[10, 1]

### Podaci u `DataFrame` strukturi se mogu filtrirati:
* `df[df['kolona'] > vrednost]` - filtrira redove gde je vrednost u zadatoj koloni veći od određene vrednosti
* `df[(df['kolona1'] > vrednost1) & (df['kolona2'] == 'vrednost2')]` - kombinovanje uslova

In [None]:
df[df['godina_studija'] > 3]

In [None]:
df[(df['godina_studija'] > 3) & (df['prosek_ocena'] > 7.0)]

### Podaci u `DataFrame` strukturi se mogu agregirati:
* `df.groupby('kolona')` - grupisanje podataka po koloni
* `df.groupby('kolona1')['kolona2'].mean()` - grupisanje podataka po vrednostima u koloni u računanje srednje vrednosti drugih kolona

In [None]:
df.groupby('godina_studija')['prosek_ocena'].max()

### Podaci u `DataFrame` strukturi se mogu manipulisati:
* `df['nova_kolona'] = df['kolona1'] + df['kolona2']` - dodavanje nove kolone
* `df['kolona'].apply(funkcija)` - primenjuje se funkcija na svaki red `axis=1` ili kolonu `axis=0`. Umesto funkcije može da se zada `lambda` izraz.

In [None]:
df['index'] = df['ime'] + df['godina_studija'].astype(str)
df.head(10)

In [None]:
# dodavanje 10% na vrednosti u koloni `prosecna_ocena`, axis=0 je podrazumevana vrednost
df['prosek_povecan'] = df['prosek_ocena'].apply(lambda x: x * 1.1)
df.head(10)

### 6. Zadatak 
Učitati podatke iz `data/studenti.csv` fajla koji sadrži informacije o studentima i njihovim ocenama. 
1. Prikazati prvih 4 redova
2. Izračunati prosečnu ocenu po godini studija
3. Pronaći studenta sa najvećom prosečnom ocenom
4. Dodati novu kolonu `status` koja ima vrednost `Položio` ako je prosek veći ili jedna 6, ili `Nije položio` ako je prosek manji od 6
5. Sačuvati rezultate u novi CSV fajl pod nazivom `data/studenti_izvestaj.csv`